我想构造一个xpath查询,它将返回一个“div”或“table”元素,只要它有一个包含文本“abc”的后代。唯一需要注意的是,它不能有任何div或table子代。

<div>
  <table>
    <form>
      <div>
        <span>
          <p>abcdefg</p>
        </span>
      </div>
      <table>
        <span>
          <p>123456</p>
        </span>
      </table>
    </form>
  </table>
</div>

因此,此查询的唯一正确结果是:
/div/table/form/div

我最好的尝试是这样的:
//div[contains(//text(), "abc") and not(descendant::div or descendant::table)] | //table[contains(//text(), "abc") and not(descendant::div or descendant::table)]

但不返回正确的结果。
谢谢你的帮助。

最佳答案

不同的东西:)

//text()[contains(.,'abc')]/ancestor::*[self::div or self::table][1]

似乎比其他解决方案要短得多,不是吗?:)
翻译成简单英语:对于文档中包含字符串"abc"的任何文本节点,请选择其第一个祖先adiv或atable
这更有效,因为只需要对文档树进行一次完整扫描(而不需要任何其他扫描),而且与ancestor::*(树)扫描相比,descendent::遍历非常便宜。
要验证此解决方案“确实有效”:
<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output omit-xml-declaration="yes" indent="yes"/>
 <xsl:strip-space elements="*"/>

 <xsl:template match="/">
  <xsl:copy-of select=
  "//text()[contains(.,'abc')]/ancestor::*[self::div or self::table][1] "/>
 </xsl:template>
</xsl:stylesheet>

对提供的XML文档执行此转换时:
<div>
  <table>
    <form>
      <div>
        <span>
          <p>abcdefg</p>
        </span>
      </div>
      <table>
        <span>
          <p>123456</p>
        </span>
      </table>
    </form>
  </table>
</div>

得到想要的正确结果:
<div>
   <span>
      <p>abcdefg</p>
   </span>
</div>

注意:不必使用xslt——任何xpath 1.0主机——比如dom,都必须获得相同的结果。

关于xml - 带有后代和后代text()谓词的XPath查询,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/3920957/

10-16 01:13