我正在尝试计算每个类别(类别)出现数字(Knumber)的次数,以下是我的示例数据。

Knumber category
K9  red
K1  white
K1  white
K9  white
K6  blue


我正在尝试使用熊猫将其纳入以下内容。

Knumber category    count
K9  red 1
K1  white   2
K9  white   1
K6  blue    1


我已经使用df['Knumber'].value_counts()弄乱了value.counts,但是显然只计算Knumbers,您能帮我将其他列“ category”带入方程式吗?

最佳答案

使用Pandas groupby和size函数获取计数。 agg方法允许我们为聚合列传递名称。

 (df
.groupby(['Knumber','category'])
.agg(count= ('category','size'))
.reset_index()
 )


   Knumber  category    count
0   K1  white   2
1   K6  blue    1
2   K9  red 1
3   K9  white   1

关于python - 根据两列计算唯一值的出现,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/60031152/

10-12 22:07