我创建了10个不同类型的xml文档,例如一个包含书籍详细信息,另一个包含电影详细信息或新闻标题等。此类xml文档之一是books.xml,如下所示:

<bookstore>
    <book category="COOKING">
         <title lang="english">Everyday Italian</title>
         <author>Giada De Laurentiis</author>
         <year>2005</year>
         <price>200.00</price>
    </book>

    <book category="CHILDREN">
         <title lang="english">Harry Potter</title>
         <author>J K. Rowling </author>
         <year>2005</year>
         <price>625.00</price>
    </book>
</bookstore>


我想通过在所有10个xml文档中搜索它们来计算用户输入的单词。这些词不过是具有属性及其各自值的元素。

例如:用户输入类别

从上面的例子中可以看到类别是一个属性并且被写了两次。因此,根据此输出应为“ 2”,并且如果其他9个文档中存在此单词类别,则相应地将计数进行升级。如何在不指定元素名称的情况下针对单个文档执行此操作。它基本上是xml解析,那我该怎么办呢?这对我来说是新的,我面临一些问题。

///////////////////////////////////////////////////// ////////////////////////////////

如果我想使用简单的文档而不是模式,该怎么办?它与xml解析有关,您能告诉我如何在dom模型对象中使用nodelist对象。

请帮忙。

最佳答案

如果您要加载此类XML文档,则可以执行以下步骤


摆脱属性中的数据。更改以下文档的格式

<book>
     <category>CHILDREN</category>
     <lang>english</lang>
     <title>Harry Potter</title>
     <author>J K. Rowling </author>
     <year>2005</year>
     <price>625.00</price>
</book>

使用Sphinx使用xmlpipe data source索引文档

关于python - 从xml文档中提取元素属性和值,而无需在python中指定元素,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/11281220/

10-14 16:19
查看更多