我有一个json文件,我想从该文件中将特定值检索到dataframe列中,例如
{'Benot':'50455','Madri':'18017','Madrar':'Ossur','Application':'Soft Top Post-op Shoe','Color':'Black','FasteningType':'Contact Closure','Material':'Cotton / Polyester','ShoeSize':'Male 9 to 11','Size':'Large','Style':'Open Toe / Closed Heel','Code':'42241709','User':'Male'}
{'Benot':'501455','Madri':'180117','Madrar':'Osur','Application':'SoftShoe','Color':'Black','Material':'Cotton / Polyester','ShoeSize':'Male 9 to 11','Size':'Large','Code':'42241709','User':'Male'}
问题是每个{}内都没有相同的数据,例如'ShoeSize':'男性9到11'在一行中预设,但在另一行和许多其他字段中未预设
我只想阅读'Benot','Madri','Madrar','Application','Code',有任何可能的方式只能在数据框中读取它
当我读取文件时会引发错误
data = pd.read_csv('McKessonFullData.txt')
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd6 in position 9: invalid continuation byte
是否有可能读取特定值并将其保存为数据帧
最佳答案
看来您需要read_json
和lines=True
:
data = pd.read_json('McKessonFullData.txt', lines=True)