我正在使用php libcurl加载页面。现在我需要得到这个页面的标签的内容,以及一些其他信息。我尝试过使用simplexml解析它,但没有成功,因为页面不是有效的xml。你能建议其他方法来轻松获取标记的内容吗?谢谢您.
最佳答案
您可以使用DOMDocument::loadHTML。
这将与“标题”相呼应:
<?php
$doc = <<<HTML
<html>
<head>
<title>The title</title>
<body>
hhhhhh
HTML;
libxml_use_internal_errors(true);
$d = new DOMDocument;
$d->loadHTML($doc);
$ts = $d->getElementsByTagName("title");
if ($ts->length > 0) {
echo $ts->item(0)->textContent;
}