我试图计算数据帧中某些值的计数,如

user_id  event_type
    1         a
    1         a
    1         b
    2         a
    2         b
    2         c

我想要像这样的桌子
user_id  event_type  event_type_a  event_type_b  event_type_c
    1         a           2              1             0
    1         a           2              1             0
    1         b           2              1             0
    2         a           1              1             1
    2         b           1              1             1
    2         c           1              1             1

我试过像
df[' event_type_a'] = df['user_id', 'event_type'].where(df['event_type']=='a').groupby([user_id]).count()

把桌子弄得像
user_id    count_a
   1          2
   2          1

如何将此值插入到默认df中,以填充所有没有nan项的行?
可能存在的方法,例如,"insert into df_1['column'] from df_2['column'] where df_1['user_id'] == df_1['user_id'] "

最佳答案

crosstabadd_prefix一起用于新列名和join

df2 = pd.crosstab(df['user_id'],df['event_type'])
#alternatives
#df2 = df.groupby(['user_id','event_type']).size().unstack(fill_value=0)
#df2 = df.pivot_table(index='user_id', columns='event_type', fill_value=0, aggfunc='size')

df = df.join(df2.add_prefix('event_type_'), on='user_id')
print (df)
   user_id event_type  event_type_a  event_type_b  event_type_c
0        1          a             2             1             0
1        1          a             2             1             0
2        1          b             2             1             0
3        2          a             1             1             1
4        2          b             1             1             1
5        2          c             1             1             1

08-24 17:24