我正在建立一个网站,用户将在其中提供其他页面的URL,并且代码将读取(而不是打开)该页面并提取页面的一部分。
说,我提供了此页面的URL,并获得了该页面的问题标题。
我怎样才能做到这一点。?
我尝试使用AJAX创建HTTPRequest
的对象,但无法读取页面的特定部分。 (例如某些#id的innerHTML)
最佳答案
为此有一个PHP库,它称为PHP Simple HTML DOM Parser
// Create DOM from URL or file
$html = file_get_html('http://www.google.com/');
// Find all images
foreach($html->find('img') as $element)
echo $element->src . '<br>';
// Find all links
foreach($html->find('a') as $element)
echo $element->href . '<br>';