我使用Xerces C++ API编写了XML解析器。我有方法来获取似乎间歇性工作的节点值,我不确定为什么。

我是XML的新手,所以请谅解如果我没有所有正确的术语。

例如,我可以成功验证解析XML文件,如下所示:

<?xml version="1.0" encoding="UTF-8"?>
<RequestMessage xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="../schema/Config.xsd">
  <MsgHeader>
    <MessageID>0</MessageID>
    <Gic>0000</Gic>
    <Fcg>1</Fgc>
    <EventID>0</EventID>
  </MsgHeader>
  <PrimaryRate>
    <Rate>MAX_RATE</Rate>
    <Value>1</Value>
  </PrimaryRate>
  <SecondaryRate>
    <Rate>MAX_RATE</Rate>
    <Value>2</Value>
  </SecondaryRate>
 <Mode>Enable</Mode>
 <Toggle>On</Toggle>
</RequestMessage>

例如,让我在“MsgHeader”下寻找“Fgc”的值。我可以使用DOMNode::getNodeName()成功获取消息头的节点名称,并且可以获取DOMNodeList中的所有子节点并遍历它们。但是,当我遍历子节点并使用DOMNode::getNodeName()打印出它们的节点名称时,将输出字符串#Text。当尝试使用DOMNode::getNodeValue()或DOMNode::getTextContent()获取值时,字符串为空。

例如:
xercesc::DOMNodeList *list = DOMDoc->getElementsByTagName(tagname);

for(XMLSize_t i=0; i<list->getLength(); i++) {
   if(list->item(i)->hasChildNode()) {
      xercesc::DOMNodeList *children = nodeList->item(i)->getChildNodes();
      for(XMLSize_t j=0; j<list->getLength(); j++) {
         xercesc::DOMNode *node = list->item(j);
         XMLCh *name = node->getNodeName();
         XMLCh *value = node->getNodeValue();
         XMLCh *text = node->getTextContent();
         cout << "Name: " << xercesc::XMLString::Transcode(name) << endl;
         cout << "Value: " << xercesc::XMLString::Transcode(value) << endl;
         cout << "Text: " << xercesc::XMLString::Transcode(text) << endl;
      }
   }
}

OUTPUT:

Name: #Text
Value:
Text:

任何见解将不胜感激!

最佳答案

默认情况下,xerces将空格(制表符,结束行和空格)视为textNode。
但是您可以为解析器设置以下选项(继承自AbstractDOMParser):

domParser.setIncludeIgnorableWhitespace(false);

并且在解析期间将忽略空格。

10-08 14:39