我正在使用php libcurl加载页面。现在我需要得到这个页面的标签的内容,以及一些其他信息。我尝试过使用simplexml解析它,但没有成功,因为页面不是有效的xml。你能建议其他方法来轻松获取标记的内容吗?谢谢您.

最佳答案

您可以使用DOMDocument::loadHTML
这将与“标题”相呼应:

<?php

$doc = <<<HTML
<html>
<head>
<title>The title</title>
<body>
hhhhhh
HTML;

libxml_use_internal_errors(true);
$d = new DOMDocument;
$d->loadHTML($doc);
$ts = $d->getElementsByTagName("title");
if ($ts->length > 0) {
    echo $ts->item(0)->textContent;
}

10-05 20:40
查看更多