你能帮我找到一种方法来使用 Goutte 从元描述、元关键字和机器人内容中获取内容吗?另外,我如何定位 <link rel="stylesheet" href="">
和 <script>
?
下面是我用来获取 <title>
内容的 PHP:
require_once 'goutte.phar';
use Goutte\Client;
$client = new Client();
$crawler = $client->request('GET', 'http://stackoverflow.com/');
$crawler->filter('title')->each(function ($node) {
$content .= "Title: ".$node->text()."";
echo $content;
});
这是 Goutte 的链接 - https://github.com/fabpot/goutte
最佳答案
您可以使用:
$crawler->filterXpath('//meta[@name="description"]')->attr('content');