我知道skip rows允许您传递一个包含要跳过的行索引的列表。但是,我有要保留的行的索引。
假设我的cvs文件在数百万行中是这样的:
A B
0 1 2
1 3 4
2 5 6
3 7 8
4 9 0
我想加载的索引列表只有2,3,所以
index_list = [2,3]
skiprows函数的输入应该是[0,1,4]。不过,我只有[2,3]个空位。
我在尝试类似的事情:
pd.read_csv(path, skiprows = ~index_list)
但没有运气…有什么建议吗?
谢谢你的帮助,
最佳答案
我想你需要先找到行数,比如this。
num_lines = sum(1 for line in open('myfile.txt'))
然后需要删除
index_list
的索引:to_exclude = [i for i in num_lines if i not in index_list]
然后加载数据:
pd.read_csv(path, skiprows = to_exclude)