例如

train = pd.DataFrame({"letter":["hem", "hem", "hem", "kiran","kiran"], "val": ['A','B','C','A','B']})
train

letter  val
hem     A
hem     B
hem     C
kiran   A
kiran   B


train=pd.concat([train,pd.get_dummies(train['val'])], axis=1)

letter  val A   B   C
hem     A   1   0   0
hem     B   0   1   0
hem     C   0   0   1
kiran   A   1   0   0
kiran   B   0   1   0


但是如何从唯一字母生成向量
这意味着基于y列,它为每个y值创建虚拟值
我的查询是如何基于y为每个x值创建向量

就像我想要的下表?

letter      A   B   C
hem         1   1   1
kiran       1   1   0

最佳答案

在代码末尾添加以下代码:

print(train.groupby('letter', as_index=False).sum())

关于python - 如何从具有相同x值的多类标签生成二进制矢量,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/57568087/

10-13 07:29