我在csv文件中有以下行
"\"xyz\"; blabla";"u98r34u98r3"
应该包含两个字段:
"\"xyz\"; blabla"
和"u98r34u98r3"
我正在尝试在python 3.4.3上使用
pandas.read_csv()
导入它,但它仅提供三个字段:xyz"
,blabla"
和u98r34u98r3
我尝试了
escapechar=
,quotechar=
和doublequote=
选项,但没有成功。//编辑:
问题是,我提取了特定的片段并尝试将其解析为这样的字符串:
from io import StringIO
import pandas as pd
data = u'"\"xyz\"; blabla";"u98r34u98r3"'
pd.read_csv(StringIO(data), sep=";", escapechar="\\")
但是它在解析完整文件时起作用。
最佳答案
在熊猫0.19.2中使用sep=";"
和escapechar="\\"
为我工作:
In [27]: df = pd.read_csv("quote.csv", header=None, sep=";", escapechar="\\")
In [28]: df
Out[28]:
0 1
0 "xyz"; blabla u98r34u98r3
In [29]: df.values
Out[29]: array([['"xyz"; blabla', 'u98r34u98r3']], dtype=object)
关于python - 如何导入具有复杂字段的csv,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43096944/