我想将空格分隔的数据加载到pandas数据帧中。如果使用sep='\s+',则会出现错误CParserError: Error tokenizing data. C error: Expected 7 fields in line 5, saw 9

df = pd.read_table("data.rpt",sep='\s+',index_col=False)


我可以使用空格作为分隔符在Excel中打开此文件。如何用熊猫解决这个问题?

文件的第一行:

Id IdEvent  Agent   Sist  Group   Con CInt
-- -------  -----   ----  -----   --- ----
18 2016101  B0C     XCX   ROD F   DC  0
19 2016101  A0C     DCX   APT     AD  5
15 2016103  V0C     XCX   ROD S   DC  0
16 2016102  N0C     XCX   ROD     CD  0

最佳答案

使用read_fwf()方法:

In [125]: pd.read_fwf(fn, skiprows=[1])
Out[125]:
   Id  IdEvent Agent Sist  Group Con  CInt
0  18  2016101   B0C  XCX  ROD F  DC     0
1  19  2016101   A0C  DCX    APT  AD     5
2  15  2016103   V0C  XCX  ROD S  DC     0
3  16  2016102   N0C  XCX    ROD  CD     0

关于python - 如何将空间分隔的文件加载到pandas数据框中?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/42208832/

10-12 21:27