我正在寻找使用python中的pandas将来自.xlsx文件的相关数据合并到许多列中的逻辑的逻辑。根据列包含的信息,组合每个不同列的逻辑将有所不同。例如:
input:
ID,when_carpool,smoking,vehicle,passengers
0,weekdays,yes,truck,3
1,weekends,no,sedan,4
2,weekdays,no,van,6
3,weekdays,no,van,5
4,weekends,yes,sedan,3
我有成千上万的行要处理,请注意,我要转换“吸烟”列的值,因此它不是所有列的简单串联。
output:
ID,carpool_info
0,weekdays+smoking+truck+3
1,weekends+nonsmoking+sedan+4
2,weekdays+nonsmoking+van+6
3,weekdays+nonsmoking+van+5
4,weekends+smoking+sedan+3
最佳答案
将所有列合并为一个新列:
df["carpool_info"] = df.apply(lambda x: "+".join([str(x[i]) for i in range(len(x))]),axis=1)
然后删除不需要的其他列(另请参见此处:Delete column from pandas DataFrame),或仅使用系列
carpool_Info = df [“ carpool_info”]
关于python - 将不同列中的数据连接到单个列中(pandas,python),我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/24151207/