我正在寻找使用python中的pandas将来自.xlsx文件的相关数据合并到许多列中的逻辑的逻辑。根据列包含的信息,组合每个不同列的逻辑将有所不同。例如:

input:
ID,when_carpool,smoking,vehicle,passengers
0,weekdays,yes,truck,3
1,weekends,no,sedan,4
2,weekdays,no,van,6
3,weekdays,no,van,5
4,weekends,yes,sedan,3


我有成千上万的行要处理,请注意,我要转换“吸烟”列的值,因此它不是所有列的简单串联。

output:
ID,carpool_info
0,weekdays+smoking+truck+3
1,weekends+nonsmoking+sedan+4
2,weekdays+nonsmoking+van+6
3,weekdays+nonsmoking+van+5
4,weekends+smoking+sedan+3

最佳答案

将所有列合并为一个新列:

  df["carpool_info"] =  df.apply(lambda x: "+".join([str(x[i]) for i in range(len(x))]),axis=1)


然后删除不需要的其他列(另请参见此处:Delete column from pandas DataFrame),或仅使用系列
     carpool_Info = df [“ carpool_info”]

关于python - 将不同列中的数据连接到单个列中(pandas,python),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/24151207/

10-14 08:13