Abril 22, 2009 por tolito
Categoría:
Vamos a ver como gracias a la "DOM Extension" de PHP podemos extraer todos los enlaces de una página web con un sencillo script PHP, sin necesidad de complicarnos con expresiones regulares.
Aquí os dejo un ejemplo muy sencillo comentado para que veáis como funciona:
<?php
//Decimos a libxml que no muestre errores
$original_config = libxml_use_internal_errors(true);
libxml_clear_errors();
//Cargamos el archivo html
$html = new DOMDocument();
$html->loadHtmlFile('http://www.chungarratadas.com');
//Usamos DOMXPath para buscar los enlaces (/a)
$xpath = new DOMXPath($html);
$enlaces = $xpath->query('//a');
//Recorremos todos los enlaces encontrados y mostramos la url(href)
foreach ($enlaces as $enlace)
{
echo $enlace->getAttribute('href')."<br/>";
}
//Devolvemos a su estado original el reporte de errores de libxml
libxml_clear_errors();
libxml_use_internal_errors($original_config);
?>
Un saludo a todos!

Últimos Comentarios
hace 7 semanas 1 día
hace 8 semanas 20 horas
hace 8 semanas 2 días
hace 9 semanas 6 días
hace 12 semanas 4 días
hace 13 semanas 5 días
hace 14 semanas 16 horas
hace 14 semanas 2 días
hace 14 semanas 3 días
hace 15 semanas 15 horas