我的输入xml是

          String xml=  "<?xml version=\"1.0\" encoding=\"UTF-8\"?>\n" +
            "<disks-array>\n" +
              "<array-item>\n" +
               " <value>\n" +
                  "<scsi>\n" +
                   "<bus>0</bus>\n" +
                    "<unit>0</unit>\n" +
                  "</scsi>\n" +
                  "<backing>\n" +
                   "<vmdk_file>[909_TCUP_02] u999orcat017t/u999orcat017t.vmdk</vmdk_file>\n" +
                    "<type>VMDK_FILE</type>\n" +
                  "</backing>\n" +
                  "<label>Hard disk 1</label>\n" +
                  "<type>SCSI</type>\n" +
                  "<capacity>107374182400</capacity>\n" +
                "</value>\n" +
                "<key>2000</key>\n" +
              "</array-item>\n" +
            "</disks-array>"


XPath过滤器是

"//array-item[contains(./value/backing/vmdk_file/text(),'u999orcat017t/u999orcat017t.vmdk')]"


这是我的解析和过滤代码

        Document doc = DocumentHelper.parseText(xml);

        XPath xp = DocumentHelper.createXPath(xpathQuery);

        // evaluate the xpath
        Object xpResult = xp.evaluate(doc);


理想情况下,它应该返回数组项/ value / vmdk_file包含给定文本的文本。但是,它给了我空字符串。

我正在使用dom4j 1.61和jaxen 1.1.1版本库。

怎么了?

最佳答案

最终,在经过数小时的调试之后,终于找到了错误解析xml的根本原因。文本值分为多个节点,而不是单个节点。查看突出显示的图片
java - XPath解析失败,带有dom4j的文本功能-LMLPHP
原来这是仍在打开的dom4j库中的错误
https://github.com/dom4j/dom4j/issues/21
解决方法是调用document.normalize()来解决文本节点。

09-27 15:12