我想构造一个xpath查询,它将返回一个“div”或“table”元素,只要它有一个包含文本“abc”的后代。唯一需要注意的是,它不能有任何div或table子代。
<div>
<table>
<form>
<div>
<span>
<p>abcdefg</p>
</span>
</div>
<table>
<span>
<p>123456</p>
</span>
</table>
</form>
</table>
</div>
因此,此查询的唯一正确结果是:
/div/table/form/div
我最好的尝试是这样的:
//div[contains(//text(), "abc") and not(descendant::div or descendant::table)] | //table[contains(//text(), "abc") and not(descendant::div or descendant::table)]
但不返回正确的结果。
谢谢你的帮助。
最佳答案
不同的东西:)
//text()[contains(.,'abc')]/ancestor::*[self::div or self::table][1]
似乎比其他解决方案要短得多,不是吗?:)
翻译成简单英语:对于文档中包含字符串
"abc"
的任何文本节点,请选择其第一个祖先adiv
或atable
。这更有效,因为只需要对文档树进行一次完整扫描(而不需要任何其他扫描),而且与
ancestor::*
(树)扫描相比,descendent::
遍历非常便宜。要验证此解决方案“确实有效”:
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output omit-xml-declaration="yes" indent="yes"/>
<xsl:strip-space elements="*"/>
<xsl:template match="/">
<xsl:copy-of select=
"//text()[contains(.,'abc')]/ancestor::*[self::div or self::table][1] "/>
</xsl:template>
</xsl:stylesheet>
对提供的XML文档执行此转换时:
<div>
<table>
<form>
<div>
<span>
<p>abcdefg</p>
</span>
</div>
<table>
<span>
<p>123456</p>
</span>
</table>
</form>
</table>
</div>
得到想要的正确结果:
<div>
<span>
<p>abcdefg</p>
</span>
</div>
注意:不必使用xslt——任何xpath 1.0主机——比如dom,都必须获得相同的结果。
关于xml - 带有后代和后代text()谓词的XPath查询,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/3920957/