我有一个元组列表:

[ ('A',100), ('B',50), ('A',50), ('B',20), ('C',10) ]

我试图总结所有具有相同字母的数字。 IE。我要输出
[('A', 150), ('B', 70), ('C',10)]

我曾尝试使用 set 来获取唯一值,但是当我尝试将第一个元素与我得到的集合进行比较时
TypeError: unsupported operand type(s) for +: 'int' and 'str'

任何按字母匹配数字的快速解决方案?

最佳答案

这是一个(半?)-liner:按字母分组(您需要先对其进行排序),然后取元组的第二个条目的总和。

from itertools import groupby
from operator import itemgetter

data = [('A', 100), ('B', 50), ('A', 50), ('B', 20), ('C', 10)]
res = [(k, sum(map(itemgetter(1), g)))
       for k, g in groupby(sorted(data, key=itemgetter(0)), key=itemgetter(0))]
print(res)
// => [('A', 150), ('B', 70), ('C', 10)]

以上是 O(n log n) — 排序是最昂贵的操作。如果您的输入列表确实很大,那么以下 O(n) 方法可能会更好地为您服务:
from collections import defaultdict

data = [('A', 100), ('B', 50), ('A', 50), ('B', 20), ('C', 10)]

d = defaultdict(int)
for letter, value in data:
    d[letter] += value
res = list(d.items())
print(res)
// => [('B', 70), ('C', 10), ('A', 150)]

关于python - 按元组列表中的字母对数字求和,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/39734549/

10-10 17:22
查看更多