我有以下csv,其中第一行为标题:
id,data
a,"{'1': 0.7778, '3': 0.5882, '2': 0.9524, '4': 0.5556}"
b,"{'1': 0.7778, '3': 0.5, '2': 0.7059, '4': 0.2222}"
c,"{'1': 0.8182, '3': 0.2609, '2': 0.5882}"
我需要做这样的事情
id 1 2 3 4
a 0.7778 0.9524 0.5882 0.5556
b 0.7778 0.7059 0.5 0.2222
c 0.8182 0.5882 0.2609 NaN
字典的键是列。
如何使用 Pandas 来做到这一点?
最佳答案
您可以使用Python的 ast
模块执行此操作:
import ast
import pandas as pd
df = pd.read_csv('/path/to/your.csv')
dict_df = pd.DataFrame([ast.literal_eval(i) for i in df.data.values])
>>> dict_df
1 2 3 4
0 0.7778 0.9524 0.5882 0.5556
1 0.7778 0.7059 0.5000 0.2222
2 0.8182 0.5882 0.2609 NaN
df = df.drop('data',axis=1)
final_df = pd.concat([df,dict_df],axis=1)
>>> final_df
id 1 2 3 4
0 a 0.7778 0.9524 0.5882 0.5556
1 b 0.7778 0.7059 0.5000 0.2222
2 c 0.8182 0.5882 0.2609 NaN