我正在使用 python 数据库和 Pandas 。目前我的数据库显示如下:
Employer Account_Num
AAA 123
BBB 456
AAA 789
AAA 123
BBB 101
CCC 112
我可以将它放入一个计算所有 Account_Num 的表中,如下所示:
Employer Account_Num
AAA 3
BBB 2
CCC 1
我使用此代码来实现上述目的:
bigdata.groupby(['Employer'])[['Account_Num']].count()
但我只需要计算唯一的 Account_Num。应该是这样的:
Employer Account_Num
AAA 2
BBB 2
CCC 1
我可以实现这一目标的最佳方法是什么?谢谢!
最佳答案
您正在寻找 nunique()
。
df.groupby('Employer').Account_Num.nunique()
演示
>>> df.groupby('Employer').Account_Num.nunique()
Employer
AAA 2
BBB 2
CCC 1
Name: Account_Num, dtype: int64
关于python - 计算在 Python 中分组的唯一值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42591017/