Este tutorial mostra como fazer um script em PHP5 que analisa uma página HTML e obtém os links (tags <a></a>), armazenando-os em uma tabela no banco de dados. O legal é que ele usa
DOM e
XPath para obter as tags, sendo totalmente desnecessário o uso de expressões regulares, tornando o código muito mais simples e legível. Ao invés daquelas ERs enormes, algo como:
$hrefs = $xpath->evaluate("/html/body//a");
obtém todas as tags <a></a> da página, retornando um array. Simples, prático e rápido. ;)
97214496-7024-4072-9b22-d495f2c4759d|0|.0