我正在开发一个自动化测试应用程序,目前正在编写一个函数来比较两个应该相同但可能不相同的 XML 文件之间的值。这是我正在尝试处理的 XML 示例:

<?xml version="1.0" encoding="utf-8"?>
<report xmlns="http://www.**.com/**">
  <subreport name="RBDReport">
    <record rowNumber="1">
      <field name="Time">
        <value>0</value>
      </field>
      <field name="Reliability">
        <value>1.000000</value>
      </field>
      <field name="Unreliability">
        <value>0.000000</value>
      </field>
      <field name="Availability">
        <value> </value>
      </field>
      <field name="Unavailability">
        <value> </value>
      </field>
      <field name="Failure Rate">
        <value>N/A</value>
      </field>
      <field name="Number of Failures">
        <value> </value>
      </field>
      <field name="Total Downtime">
        <value> </value>
      </field>
    </record>

(请注意,可能有多个 <subreport> 元素,其中可能有多个 <record> 元素。)

我想要的是提取两个文档的 <value> 标签,然后比较它们的值。那部分我知道该怎么做。问题是提取本身。

由于我被困在 C++ 中,我使用 MSXML,并编写了一个包装器来允许我的应用程序抽象出实际的 XML 操作,以防我决定更改我的数据格式。

该包装器 CSimpleXMLParser 加载一个 XML 文档并将其“顶级记录”设置为 XML 文档的文档元素。 (CRecord 是一个抽象类,CXMLRecord 是其子类之一,它可以单独或按组访问子记录,还允许访问记录的“值”(子元素或属性的值,在 CXMLRecord 的情况下) .) CXMLRecord 包含一个 MSXML::MSXMLDOMNodePtr 和一个指向 CSimpleXMLParser 实例的指针。) 包装器还包含用于返回子项的实用程序函数,CXMLRecord 使用这些函数返回其子记录。

在我的代码中,我执行以下操作(尝试返回所有 <subreport> 节点以查看它是否有效):
CSimpleXMLParser parserReportData;
parserReportData.OpenXMLDocument(strPathToXML);
bool bGetChildrenSuccess = parserReportData.GetFirstRecord()->GetChildRecords(listpChildren, _T("subreport"));

这总是返回false。 CXMLRecord::GetChildRecords() 的实现主要是
MSXML2::IXMLDOMNodeListPtr pListChildren = m_pParser->SelectNodes(strPath, m_pXMLNode);

if (pListChildren->Getlength() == 0)
{
    return false;
}

for (long l = 0; l < pListChildren->Getlength(); ++l)
{
    listRecords.push_back(new CXMLRecord(pListChildren->Getitem(l), m_pParser));
}

return true;

而 CSimpleXMLParser::SelectNodes() 是:
MSXML2::IXMLDOMNodeListPtr CSimpleXMLParser::SelectNodes(LPCTSTR strXPathFilter, MSXML2::IXMLDOMNodePtr pXMLNode)
{
    return pXMLNode->selectNodes(_bstr_t(strXPathFilter));
}

运行时,顶部记录肯定已正确设置为 <report> 元素。我可以用它做各种各样的事情,比如获取它的子节点(通过 MSXML 接口(interface),而不是通过我的包装器)或其名称等。我知道我的包装器可以工作,因为我在应用程序的其他地方使用它进行解析一个 XML 配置文件,它可以完美地工作。

我想也许我在 XPath 查询表达式上做了一些错误的事情,但是我能想到的每一个排列都没有带来任何乐趣。当我尝试处理此 XML 文件时,MSXML::IXMLDOMNodeListPtr 返回的 IXMLDOMNodePtr::SelectNodes() 长度始终为 0。

这真让我抓狂。

最佳答案

我习惯用 .NET 的 XmlDocument 对象来做这件事,但我认为这里的效果是一样的:

如果 XML 文档包含一个 namespace ——甚至是一个未命名的 namespace ——那么 Xpath 查询也必须使用一个 namespace 。因此,您必须将命名空间添加到 XMLDoument 中,您也可以在代码中给出一个名称,并在 XPATH 查询中包含前缀(前缀在 xml 文档和xpath,只要命名空间将其整理出来)

所以,当您使用像 /report/subreport/record/field/value 这样的 XPath 时,您实际上需要首先设置文档的命名空间:

  pXMLDoc->setProperty(_bstr_t("SelectionNamespaces"),
                       _bstr_t("xmlns:r="http://www.**.com/**"));

然后使用 selectNodes() /r:report/r:subreport/r:record/r:field/r:value

关于c++ - MSXML 选择节点不工作,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/284716/

10-11 16:25