我有一个RDF / XML元素,想找出特定标记的开始和结束之间的所有元素。我该怎么办?

例如 :

<cim:BaseVoltage rdf:ID="_0526B48408F744919E7C03672FCD0D71">
<cim:BaseVoltage.isDC>false</cim:BaseVoltage.isDC>
<cim:BaseVoltage.nominalVoltage>400.000000000</cim:BaseVoltage.nominalVoltage>
</cim:BaseVoltage>


我想提取值BaseVoltage.isDC和BaseVoltage.nominalVoltage,因为它们位于的开始标记和结束标记之间。如前所述,这只是一个示例,我还有更多这样的开始和结束标记。

我曾考虑过使用Xpath做到这一点,但我不确定如何做到。

最佳答案

对于这个问题,使用XPath解析XML文件似乎不是一个好主意。 Rdflib使其非常容易。

import rdflib
from rdflib import Graph
from rdflib.namespace import Namespace

BASE = Namespace('http://example.org/')

graph = rdflib.Graph()
graph.parse('rdf.xml', format='xml', publicID=BASE)

for p,o in graph[BASE['#_0526B48408F744919E7C03672FCD0D71']]:
   print(p, o)

关于xpath - 如何在Python中使用XPath限制特定xml元素的开始和结束标记之间的元素提取范围?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/45203061/

10-11 22:36