<?php
$dom = new \domDocument;
$dom->loadHTML('<!DOCTYPE html>
<html lang="en">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
</head>
<body>
<div>
<h1>Title1</h1>
<p><img src="" /></p>
<h1>Title2</h1>
<p><img src="" /></p>
<h1>Title3</h1>
<p><img src="" /></p>
<h1>Title4</h1>
<p><img src="" /></p>
<p><img src="" /></p>
</div>
</body>
</html>');
$xpath = new \DOMXPath($dom);
$nodelist = $xpath->query('//div/p/img');
foreach($nodelist as $k=>$v){
$title1 = $v->parentNode->previousSibling->textContent;
}
我想检索 h1 标记内的每个文本,但 previousSibling 属性似乎不起作用,它返回一个没有标记名属性的节点,其 previousSibling 属性为“(省略对象值)”
我的路径必须遵循 img->p->previous h1 ,因为在我的情况下并非每个 p 标签都有自己的 h1 标签。
谢谢 !
最佳答案
根据您上面的标记,请注意 <p>
的直接兄弟实际上是一个换行符 \n
。
作为替代方案,您可以先检查前面的兄弟并检查它是否是 <h1>
标记,如果是,则获取其 ->nodeValue
:
$nodelist = $xpath->query('//div/p/img');
foreach($nodelist as $k=>$v) {
// $previousSibling = $
$prev = $xpath->evaluate('./preceding-sibling::*[1]', $v->parentNode);
if($prev->length > 0 && $prev->item(0)->tagName === 'h1') {
echo $prev->item(0)->nodeValue, '<br/>';
}
}
Sample Output
关于PHP DOM previousSibling 不起作用,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30075201/