我有一个包含以下数据的表:

day         concept    click    item_id
2015-05-01    A          6     s4P~Hzs1w5R12Dpyn2IK
              B          6     s4P~Hzs1w5R12Dpyn2IK
              C          1     DOwfmfFvdEIZ1IdXqTiu
              D          1     wPaYuIh~t8y7rU3HP43N
              D          7     Ya_M~2N6eX0kem8IgdSp


我想获取distint item_id的计数,并每天获取所有item_id的总点击次数,例如:

day         concept       click    count_item_id
2015-05-01    A          6        1
              B          6        1
              C          1        1
              D          8        2


我使用Python和Pandas库

最佳答案

使用groupby后跟agg

df.groupby(['day', 'concept']).agg({'click' : 'sum', 'item_id' : 'count'})

                    item_id  click
day        concept
2015-05-01 A              1      6
           B              1      6
           C              1      1
           D              2      8

10-08 04:36