我在csv文件中有以下行

"\"xyz\"; blabla";"u98r34u98r3"


应该包含两个字段:

"\"xyz\"; blabla""u98r34u98r3"

我正在尝试在python 3.4.3上使用pandas.read_csv()导入它,但它仅提供三个字段:

xyz"blabla"u98r34u98r3

我尝试了escapechar=quotechar=doublequote=选项,但没有成功。

//编辑:

问题是,我提取了特定的片段并尝试将其解析为这样的字符串:

from io import StringIO
import pandas as pd
data = u'"\"xyz\"; blabla";"u98r34u98r3"'
pd.read_csv(StringIO(data), sep=";", escapechar="\\")


但是它在解析完整文件时起作用。

最佳答案

在熊猫0.19.2中使用sep=";"escapechar="\\"为我工作:

In [27]: df = pd.read_csv("quote.csv", header=None, sep=";",  escapechar="\\")

In [28]: df
Out[28]:
               0            1
0  "xyz"; blabla  u98r34u98r3

In [29]: df.values
Out[29]: array([['"xyz"; blabla', 'u98r34u98r3']], dtype=object)

关于python - 如何导入具有复杂字段的csv,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43096944/

10-12 22:53