我在熊猫中读到的csv文件有:
#!/usr/bin/env python
import pandas as pd
import sys
filename = sys.argv[1]
df = pd.read_csv(filename)
不幸的是,这些文件的最后一行经常损坏(逗号数错误)。目前我在文本编辑器中打开每个文件并删除最后一行。
是否可以删除加载csv的同一python/pandas脚本中的最后一行,以节省执行此额外的非自动步骤的费用?
最佳答案
通过error_bad_lines=False
将自动跳过此行
df = pd.read_csv(filename, error_bad_lines=False)
error_bad_lines
的优点是,它可以跳过任何错误的行,而不会在任何错误的行上借用,但是如果最后一行总是无效的,那么skipfooter=1
更好。感谢@dextermorgan指出,
skipfooter
选项强制引擎使用比C引擎慢的python引擎来解析csv。关于python - 在 Pandas 中读取除CSV文件的最后一行,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/33689694/