我有这种格式的数据:

term_x       similar_sounding_term

insurance    insurance_policy
insurance    insurance_quote
insurance    car_insurance
car rental   rental cars in Nantucket
car rental   damaged car rental policy


我想将此数据帧转换成一个字典,其中的键是term_x,但值是该术语中所有相关值的列表,因此:

insurance : [insurance_policy, insurance_quote, car_insurance, rental cars in Nantucket....]


依此类推:

尽管答案here解决了我的问题,但它并没有像我希望的那样将列表合并到一个键下。

最佳答案

联合会

df.groupby('term_x')['similar_sounding_term'].apply(list).to_dict()
Out[1690]:
{'carrental': ['rentalcarsinNantucket', 'damagedcarrentalpolicy'],
 'insurance': ['insurance_policy', 'insurance_quote', 'car_insurance']}

10-04 17:04