rev_id worker_id label
37675 1362 1.0
37675 2408 0.0
37675 1493 0.0
37675 1439 1.0
37675 170 0.0
37675 176 0.0
37675 481 1.0
37675 487 0.0
37675 578 0.0
这是数据框的段落,我想按rev_id和
label
的值计数分组,label仅具有两个值:1&0。新数据框应具有两个新列,即label = 1,每个rev_id的label = 0。如何实现呢?
最佳答案
我认为您需要groupby
+ value_counts
并由unstack
最后一次重塑:
df = df.groupby('rev_id')['label'].value_counts().unstack()
或按两列按
groupby
并使用size
:df = df.groupby(['rev_id', 'label']).size().unstack()
print (df)
label 0.0 1.0
rev_id
37675 6 3
关于python - 如何获取指定列的值计数?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/48316383/