例如
train = pd.DataFrame({"letter":["hem", "hem", "hem", "kiran","kiran"], "val": ['A','B','C','A','B']})
train
letter val
hem A
hem B
hem C
kiran A
kiran B
train=pd.concat([train,pd.get_dummies(train['val'])], axis=1)
letter val A B C
hem A 1 0 0
hem B 0 1 0
hem C 0 0 1
kiran A 1 0 0
kiran B 0 1 0
但是如何从唯一字母生成向量
这意味着基于y列,它为每个y值创建虚拟值
我的查询是如何基于y为每个x值创建向量
就像我想要的下表?
letter A B C
hem 1 1 1
kiran 1 1 0
最佳答案
在代码末尾添加以下代码:
print(train.groupby('letter', as_index=False).sum())
关于python - 如何从具有相同x值的多类标签生成二进制矢量,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57568087/