我使用Xerces C++ API编写了XML解析器。我有方法来获取似乎间歇性工作的节点值,我不确定为什么。
我是XML的新手,所以请谅解如果我没有所有正确的术语。
例如,我可以成功验证解析XML文件,如下所示:
<?xml version="1.0" encoding="UTF-8"?>
<RequestMessage xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="../schema/Config.xsd">
<MsgHeader>
<MessageID>0</MessageID>
<Gic>0000</Gic>
<Fcg>1</Fgc>
<EventID>0</EventID>
</MsgHeader>
<PrimaryRate>
<Rate>MAX_RATE</Rate>
<Value>1</Value>
</PrimaryRate>
<SecondaryRate>
<Rate>MAX_RATE</Rate>
<Value>2</Value>
</SecondaryRate>
<Mode>Enable</Mode>
<Toggle>On</Toggle>
</RequestMessage>
例如,让我在“MsgHeader”下寻找“Fgc”的值。我可以使用DOMNode::getNodeName()成功获取消息头的节点名称,并且可以获取DOMNodeList中的所有子节点并遍历它们。但是,当我遍历子节点并使用DOMNode::getNodeName()打印出它们的节点名称时,将输出字符串#Text。当尝试使用DOMNode::getNodeValue()或DOMNode::getTextContent()获取值时,字符串为空。
例如:
xercesc::DOMNodeList *list = DOMDoc->getElementsByTagName(tagname);
for(XMLSize_t i=0; i<list->getLength(); i++) {
if(list->item(i)->hasChildNode()) {
xercesc::DOMNodeList *children = nodeList->item(i)->getChildNodes();
for(XMLSize_t j=0; j<list->getLength(); j++) {
xercesc::DOMNode *node = list->item(j);
XMLCh *name = node->getNodeName();
XMLCh *value = node->getNodeValue();
XMLCh *text = node->getTextContent();
cout << "Name: " << xercesc::XMLString::Transcode(name) << endl;
cout << "Value: " << xercesc::XMLString::Transcode(value) << endl;
cout << "Text: " << xercesc::XMLString::Transcode(text) << endl;
}
}
}
OUTPUT:
Name: #Text
Value:
Text:
任何见解将不胜感激!
最佳答案
默认情况下,xerces将空格(制表符,结束行和空格)视为textNode。
但是您可以为解析器设置以下选项(继承自AbstractDOMParser):
domParser.setIncludeIgnorableWhitespace(false);
并且在解析期间将忽略空格。