<?php

$dom = new \domDocument;
$dom->loadHTML('<!DOCTYPE html>
<html lang="en">
   <head>
      <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
   </head>
   <body>
       <div>
        <h1>Title1</h1>
        <p><img src="" /></p>
        <h1>Title2</h1>
        <p><img src="" /></p>
        <h1>Title3</h1>
        <p><img src="" /></p>
        <h1>Title4</h1>
        <p><img src="" /></p>
        <p><img src="" /></p>
       </div>
   </body>
</html>');

        $xpath = new \DOMXPath($dom);
        $nodelist = $xpath->query('//div/p/img');
        foreach($nodelist as $k=>$v){
            $title1 = $v->parentNode->previousSibling->textContent;
        }

我想检索 h1 标记内的每个文本,但 previousSibling 属性似乎不起作用,它返回一个没有标记名属性的节点,其 previousSibling 属性为“(省略对象值)”

我的路径必须遵循 img->p->previous h1 ,因为在我的情况下并非每个 p 标签都有自己的 h1 标签。

谢谢 !

最佳答案

根据您上面的标记,请注意 <p> 的直接兄弟实际上是一个换行符 \n

作为替代方案,您可以先检查前面的兄弟并检查它是否是 <h1> 标记,如果是,则获取其 ->nodeValue :

$nodelist = $xpath->query('//div/p/img');
foreach($nodelist as $k=>$v) {
    // $previousSibling = $
    $prev = $xpath->evaluate('./preceding-sibling::*[1]', $v->parentNode);
    if($prev->length > 0 && $prev->item(0)->tagName === 'h1') {
        echo $prev->item(0)->nodeValue, '<br/>';
    }
}

Sample Output

关于PHP DOM previousSibling 不起作用,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30075201/

10-14 14:39