我有一个熊猫数据框,类似于:
ColA ColB
1 1
1 1
1 1
1 2
1 2
2 1
3 2
我想要一个与Counter功能相同的输出。我需要知道每行出现的时间(所有列都是相同的)。
在这种情况下,正确的输出是:
ColA ColB Count
1 1 3
1 2 2
2 1 1
3 2 1
我试过这样的方法:
df.groupby(['ColA','ColB']).ColA.count()
但这给了我一些难看的输出,我在格式化时遇到了麻烦
最佳答案
您可以将size
与reset_index
一起使用:
print df.groupby(['ColA','ColB']).size().reset_index(name='Count')
ColA ColB Count
0 1 1 3
1 1 2 2
2 2 1 1
3 3 2 1
关于python - Pandas 计数唯一行,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/36018851/