我有2个xml文件,格式如下:

<tag1>
<tag2>
<ID>integer</ID>
<randomtags>
<RESULT>a_long_string</B>
</randomtags>
</tag2>
</tag1>
<tag1>
<tag2>
<ID>integer2</ID>
<randomtags>
<RESULT>a_long_string2</B>
</randomtags>
</tag2>
</tag1>
...
...


现在有两个具有相同格式的文件。我想显示两个文件中具有不同结果的ID。
我的算法是这样的:


从文件1获取1个ID,在文件2中搜索。如果匹配,则继续执行步骤2,否则转到下一个ID
比较两个文件中该ID的标记。

(i)如果相同-不要打印。

(ii)如果不同-打印。


我设法获得了两个仅包含和标记的列表,但是现在我无法以正确的方式应用我的算法。
我的尝试:

import re
import sys
import os

for i in range(1,len(sys.argv)):

        #Regex to fetch IDs only
        idcmd="awk '/<ID>[[:digit:]][[:digit:]]*/ {print}' %s | sed 's/<\/\?ID>//g'" % sys.argv[i]

        #Regex to fetch RESULT tag only
        resultcmd="awk '/<RESULT>.*/ {print}' %s" % sys.argv[i]


        id=os.popen(idcmd).read().split("\r\n")
        result=os.popen(resultcmd).read().split("\r\n")

        test=[[i,c] for i,c in zip(id,result)]
        print test


如果还有其他方法,请解释。谢谢

最佳答案

如果要从python文件中获取所有ID,则应执行以下操作:

id_file1, id_file2 = [], []

filename1 = "tmp.txt"
filename2 = "tmp.txt"


打开File1并获取所有iD

with open(filename1, 'r') as f:
    for line in f.readlines():
        if '<ID>' in line:
            id_file1.append(line.strip()[4:-5]


打开文件2

with open(filename2, 'r') as f:
    for line in f.readlines():
        if '<ID>' in line:
            id_file2.append(line.strip()[4:-5]


比较已解析的ID并打印它们相同时找到的ID

for value in zip(id_file1, id_file2):
    if(value[0] == value[1]): print("Found it")

关于python - 比较2个列表的元素并仅打印一个不同的元素,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/56833185/

10-12 16:42
查看更多