说我的CSV文件是这样的:


爱,像200
爱,像50
说30


这些数字代表在不同上下文中同时出现的那些单词的计数。

我想结合相似单词的计数。所以我想输出类似:


爱,像250
说30


我一直在四处张望,但似乎我被这个简单的问题所困扰。

最佳答案

没有看到确切的CSV,很难知道什么是合适的。下面的代码假定最后一个标记是一个计数,并且它与最后一个逗号之前的所有字符都匹配。

# You'd need to replace the below with the appropriate code to open your file
file = """love, like, 200
love, like, 50
love, 20
say, claim, 30"""
file = file.split("\n")

words = {}
for line in file:
    word,count=line.rsplit(",",1)   # Note this uses String.rsplit() NOT String.split()
    words[word] = words.get(word,0) + int(count)
for word in words:
    print word,": ",words[word]


并输出以下内容:

say, claim :  30
love :  20
love, like :  250

关于python - 合并和汇总相似的CSV条目,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/18690224/

10-12 18:03