我创建了10个不同类型的xml文档,例如一个包含书籍详细信息,另一个包含电影详细信息或新闻标题等。此类xml文档之一是books.xml,如下所示:
<bookstore>
<book category="COOKING">
<title lang="english">Everyday Italian</title>
<author>Giada De Laurentiis</author>
<year>2005</year>
<price>200.00</price>
</book>
<book category="CHILDREN">
<title lang="english">Harry Potter</title>
<author>J K. Rowling </author>
<year>2005</year>
<price>625.00</price>
</book>
</bookstore>
我想通过在所有10个xml文档中搜索它们来计算用户输入的单词。这些词不过是具有属性及其各自值的元素。
例如:用户输入类别
从上面的例子中可以看到类别是一个属性并且被写了两次。因此,根据此输出应为“ 2”,并且如果其他9个文档中存在此单词类别,则相应地将计数进行升级。如何在不指定元素名称的情况下针对单个文档执行此操作。它基本上是xml解析,那我该怎么办呢?这对我来说是新的,我面临一些问题。
///////////////////////////////////////////////////// ////////////////////////////////
如果我想使用简单的文档而不是模式,该怎么办?它与xml解析有关,您能告诉我如何在dom模型对象中使用nodelist对象。
请帮忙。
最佳答案
如果您要加载此类XML文档,则可以执行以下步骤
摆脱属性中的数据。更改以下文档的格式
<book>
<category>CHILDREN</category>
<lang>english</lang>
<title>Harry Potter</title>
<author>J K. Rowling </author>
<year>2005</year>
<price>625.00</price>
</book>
使用Sphinx使用xmlpipe data source索引文档
关于python - 从xml文档中提取元素属性和值,而无需在python中指定元素,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/11281220/