我正在使用 python 数据库和 Pandas 。目前我的数据库显示如下:

Employer        Account_Num
AAA             123
BBB             456
AAA             789
AAA             123
BBB             101
CCC             112

我可以将它放入一个计算所有 Account_Num 的表中,如下所示:
Employer   Account_Num
AAA        3
BBB        2
CCC        1

我使用此代码来实现上述目的:
bigdata.groupby(['Employer'])[['Account_Num']].count()

但我只需要计算唯一的 Account_Num。应该是这样的:
Employer   Account_Num
AAA        2
BBB        2
CCC        1

我可以实现这一目标的最佳方法是什么?谢谢!

最佳答案

您正在寻找 nunique()

df.groupby('Employer').Account_Num.nunique()

演示
>>> df.groupby('Employer').Account_Num.nunique()

Employer
AAA    2
BBB    2
CCC    1
Name: Account_Num, dtype: int64

关于python - 计算在 Python 中分组的唯一值,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42591017/

10-13 00:56