让我从一些背景开始。

假设我有以下列表:

interactions = [ ['O1', 'O3'],
               ['O2', 'O5'],
               ['O8', 'O10']
               ['P3', 'P5'],
               ['P2', 'P19'],
               ['P1', 'P6'] ]

列表中的每个条目(例如:O1, O3)都是两个实体之间的交互(尽管我们在此处理的都是字符串)。列表中有许多不同的实体。

我们还有以下列表:
similar = ['O1', 'P23'],
          ['O3', 'P50'],
          ['P2', 'O40'],
          ['P19', 'O22']

其中每个条目都是两个不同实体之间的相似关系。

因此 O1 类似于 P23 ,而 O3 P50 类似,并且[O1,O3]相互作用,因此相互作用['P23','P50']是转换后的相互作用。

同样, P2 O40 类似,并且 P19 O22 类似,并且[P2,P19]交互,因此交互['O40','O22']是转换后的交互。

转换后的交互将始终来自同一类型,例如:[PX,PX]或[OX,OX]。

代码

因此,我编写了以下代码来生成这些关系转移:
from collections import defaultdict

interactions = [ ['O1', 'O3'],
                 ['O2', 'O5'],
                 ['O8', 'O10']
                 ['P3', 'P5'],
                 ['P2', 'P19'],
                 ['P1', 'P6'] ]

similar = [ ['O1', 'H33'],
            ['O6', 'O9'],
            ['O4', 'H1'],
            ['O2', 'H12'] ]

def list_of_lists_to_dict(list_of_lists):
  d = defaultdict(list)
  for sublist in list_of_lists:
    d[sublist[0]].append(sublist[1])
    d[sublist[1]].append(sublist[0])
  return d

interactions_dict = list_of_lists_to_dict(interactions)
similar_dict = list_of_lists_to_dict(similar)


for key, values in interactions_dict.items():
  print "{0} interacts with: {1}".format(key, ', '.join(values))
    if key in similar_dict:
      print " {0} is similar to: {1}".format(key, ', '.join(similar_dict[key]))
      forward = True
  for value in values:
    if value in similar_dict:
      print " {0} is similar to: {1}".format(value, ', '.join(similar_dict[value]))
      reverse = True
      if forward and reverse:
        print "     thus [{0}, {1}] interact!".format(', '.join(similar_dict[key]),
         ',  '.join(similar_dict[value]))
  forward = reverse = False

我的尝试确实生成了正确的输出,但是也生成了不需要的输出。例如,有时它将在不同类型的实体O1, P1之间以及在完全相同的实体O1, O1之间生成输出。它还以不同的形式输出重复的结果,例如:O1, P1P1, O1-两者含义相同,因此我们只需要一次此条目。所有这些都是不想要的行为。

所以我的问题是,我该如何调整解决该问题的尝试?

谢谢。

最佳答案

如果相似关系既不是对称的也不是传递的:

from collections import defaultdict
from itertools import product

# entity -> similar entities
d = defaultdict(list) # use `set` if `similar` has duplicate entries
for k, v in similar:
    d[k].append(v)

for a, b in interactions:
    for x, y in product(d[a], d[b]):
       # a, b interact; a is similar to x, b is similar to y
       #note: filter undesired x, y interactions here
       print x, y # transformed interaction

关于python - 对两个列表的操作,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/14562367/

10-12 17:02