我想将空格分隔的数据加载到pandas数据帧中。如果使用sep='\s+'
,则会出现错误CParserError: Error tokenizing data. C error: Expected 7 fields in line 5, saw 9
df = pd.read_table("data.rpt",sep='\s+',index_col=False)
我可以使用空格作为分隔符在Excel中打开此文件。如何用熊猫解决这个问题?
文件的第一行:
Id IdEvent Agent Sist Group Con CInt
-- ------- ----- ---- ----- --- ----
18 2016101 B0C XCX ROD F DC 0
19 2016101 A0C DCX APT AD 5
15 2016103 V0C XCX ROD S DC 0
16 2016102 N0C XCX ROD CD 0
最佳答案
使用read_fwf()方法:
In [125]: pd.read_fwf(fn, skiprows=[1])
Out[125]:
Id IdEvent Agent Sist Group Con CInt
0 18 2016101 B0C XCX ROD F DC 0
1 19 2016101 A0C DCX APT AD 5
2 15 2016103 V0C XCX ROD S DC 0
3 16 2016102 N0C XCX ROD CD 0
关于python - 如何将空间分隔的文件加载到pandas数据框中?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42208832/