rev_id  worker_id   label
37675   1362    1.0
37675   2408    0.0
37675   1493    0.0
37675   1439    1.0
37675   170     0.0
37675   176     0.0
37675   481     1.0
37675   487     0.0
37675   578     0.0


这是数据框的段落,我想按rev_id和label的值计数分组,label仅具有两个值:1&0。新数据框应具有两个新列,即label = 1,每个rev_id的label = 0。
如何实现呢?

最佳答案

我认为您需要groupby + value_counts并由unstack最后一次重塑:

df = df.groupby('rev_id')['label'].value_counts().unstack()


或按两列按groupby并使用size

df = df.groupby(['rev_id', 'label']).size().unstack()

print (df)
label   0.0  1.0
rev_id
37675     6    3

关于python - 如何获取指定列的值计数?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48316383/

10-16 23:03