我得到一个数据框,如下所示:
user_id label
0 937922 1
1 937922 2
2 937922 2
3 937922 2
4 1369473 1
5 1330642 2
6 1330642 2
7 1330642 1
8 1330642 1
9 411741 1
10 411741 1
11 1552476 2
12 1552476 1
13 1552476 1
... ...
... ...
我想得到
label
是2
对应于每个user_id
的比例,应该如下所示:user_id label
937922 0.7500
1369473 0
1330642 0.5000
411741 0
1552476 0.3333
我知道我应该以某种方式使用
pd.groupby
并将其除以pd.groubpy(['user_id']).count()[['type']]
。但是我很难做到这一点,而且我无法搜索想要的东西。
如果不介意有人可以帮助我吗?
在此先感谢。
最佳答案
groupby
和value_counts
为您提供所有计数:
df.groupby('user_id').label.value_counts(normalize=True)
输出:
user_id label
411741 1 1.000000
937922 2 0.750000
1 0.250000
1330642 1 0.500000
2 0.500000
1369473 1 1.000000
1552476 1 0.666667
2 0.333333
Name: label, dtype: float64
关于python - 如何获得与每个`user_id`相对应的每个标签值的比例,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/56764743/