Skip to Content

No te olvides de visitar:

Script PHP para obtener los enlaces de una página Web

Categoría:

Vamos a ver como gracias a la "DOM Extension" de PHP podemos extraer todos los enlaces de una página web con un sencillo script PHP, sin necesidad de complicarnos con expresiones regulares.

Aquí os dejo un ejemplo muy sencillo comentado para que veáis como funciona:

<?php
  //Decimos a libxml que no muestre errores
  $original_config = libxml_use_internal_errors(true);
  libxml_clear_errors();

  //Cargamos el archivo html
  $html = new DOMDocument();
  $html->loadHtmlFile('http://www.chungarratadas.com');

  //Usamos DOMXPath para buscar los enlaces (/a)
  $xpath = new DOMXPath($html); 
  $enlaces = $xpath->query('//a'); 

  //Recorremos todos los enlaces encontrados y mostramos la url(href)
  foreach ($enlaces as $enlace) 
  { 
    echo $enlace->getAttribute('href')."<br/>";
  } 

  //Devolvemos a su estado original el reporte de errores de libxml
  libxml_clear_errors(); 
  libxml_use_internal_errors($original_config); 

?>

Un saludo a todos!