我在熊猫中读到的csv文件有:

#!/usr/bin/env python

import pandas as pd
import sys

filename = sys.argv[1]
df = pd.read_csv(filename)

不幸的是,这些文件的最后一行经常损坏(逗号数错误)。目前我在文本编辑器中打开每个文件并删除最后一行。
是否可以删除加载csv的同一python/pandas脚本中的最后一行,以节省执行此额外的非自动步骤的费用?

最佳答案

通过error_bad_lines=False将自动跳过此行

df = pd.read_csv(filename, error_bad_lines=False)

error_bad_lines的优点是,它可以跳过任何错误的行,而不会在任何错误的行上借用,但是如果最后一行总是无效的,那么skipfooter=1更好。
感谢@dextermorgan指出,skipfooter选项强制引擎使用比C引擎慢的python引擎来解析csv。

关于python - 在 Pandas 中读取除CSV文件的最后一行,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33689694/

10-12 18:38