我知道skip rows允许您传递一个包含要跳过的行索引的列表。但是,我有要保留的行的索引。
假设我的cvs文件在数百万行中是这样的:

  A B
0 1 2
1 3 4
2 5 6
3 7 8
4 9 0

我想加载的索引列表只有2,3,所以
index_list = [2,3]

skiprows函数的输入应该是[0,1,4]。不过,我只有[2,3]个空位。
我在尝试类似的事情:
pd.read_csv(path, skiprows = ~index_list)

但没有运气…有什么建议吗?
谢谢你的帮助,

最佳答案

我想你需要先找到行数,比如this

num_lines = sum(1 for line in open('myfile.txt'))

然后需要删除index_list的索引:
to_exclude = [i for i in num_lines if i not in index_list]

然后加载数据:
pd.read_csv(path, skiprows = to_exclude)

10-07 13:37