我有一个包含此列的数据框:

DF.head():
Email           Month    Year
[email protected]      1      2018
[email protected]      1      2018
[email protected]      2      2019
     .
     .
[email protected]     6      2019

我想要做的是获取 2018 年和 2019 年每个月的电子邮件地址总数(知道我不需要过滤,因为我只有这两年)。

这就是我所做的,但我想确保这是正确的:
 Stats = DF.groupby(['Year','Month'])['Email'].count()

有什么建议吗?

最佳答案

这要看什么需要。

如果需要排除 Email 列中不存在的缺失值或缺失值,则您的解决方案是正确的,请使用 GroupBy.count :

Stats = DF.groupby(['Year','Month'])['Email'].count()

如果需要计算所有具有缺失值的组(如果存在),请使用 GroupBy.size :
Stats = DF.groupby(['Year','Month']).size()

关于python - 如何正确分组列?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57327752/

10-15 23:30