我有一个包含此列的数据框:
DF.head():
Email Month Year
[email protected] 1 2018
[email protected] 1 2018
[email protected] 2 2019
.
.
[email protected] 6 2019
我想要做的是获取 2018 年和 2019 年每个月的电子邮件地址总数(知道我不需要过滤,因为我只有这两年)。
这就是我所做的,但我想确保这是正确的:
Stats = DF.groupby(['Year','Month'])['Email'].count()
有什么建议吗?
最佳答案
这要看什么需要。
如果需要排除 Email
列中不存在的缺失值或缺失值,则您的解决方案是正确的,请使用 GroupBy.count
:
Stats = DF.groupby(['Year','Month'])['Email'].count()
如果需要计算所有具有缺失值的组(如果存在),请使用
GroupBy.size
:Stats = DF.groupby(['Year','Month']).size()
关于python - 如何正确分组列?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57327752/