我有以下csv,其中第一行为标题:

id,data
a,"{'1': 0.7778, '3': 0.5882, '2': 0.9524, '4': 0.5556}"
b,"{'1': 0.7778, '3': 0.5, '2': 0.7059, '4': 0.2222}"
c,"{'1': 0.8182, '3': 0.2609, '2': 0.5882}"

我需要做这样的事情
id      1      2      3      4
 a 0.7778 0.9524 0.5882 0.5556
 b 0.7778 0.7059 0.5    0.2222
 c 0.8182 0.5882 0.2609    NaN

字典的键是列。

如何使用 Pandas 来做到这一点?

最佳答案

您可以使用Python的 ast 模块执行此操作:

import ast
import pandas as pd

df = pd.read_csv('/path/to/your.csv')
dict_df = pd.DataFrame([ast.literal_eval(i) for i in df.data.values])

>>> dict_df
        1       2       3       4
0  0.7778  0.9524  0.5882  0.5556
1  0.7778  0.7059  0.5000  0.2222
2  0.8182  0.5882  0.2609     NaN

df = df.drop('data',axis=1)
final_df = pd.concat([df,dict_df],axis=1)

>>> final_df
  id       1       2       3       4
0  a  0.7778  0.9524  0.5882  0.5556
1  b  0.7778  0.7059  0.5000  0.2222
2  c  0.8182  0.5882  0.2609     NaN

10-04 21:43