我正在使用pandas.read_csv()读取一个excel.csv文件。我想读入excel电子表格的两个独立的列范围,例如A:D和H:J列,以显示在最终数据框中。我知道,一旦文件使用索引加载,我就可以做到这一点,但是我可以指定2个列的加载范围吗?
我试过这样的东西。。。。
usecols=[0:3,7:9]
我知道我可以列出每一列的编号。
usecols=[0,1,2,3,7,8,9]
但我已经简化了相关文件,在我的真实文件中,我有大量的行,所以我需要能够选择2个大范围来读取。。。
最佳答案
我不确定是否有一种官方用熊猫来做这件事的方法。
但是,你可以这样做:
# say you want to extract 2 ranges of columns
# columns 5 to 14
# and columns 30 to 66
import pandas as pd
range1 = [i for i in range(5,15)]
range2 = [i for i in range(30,67)]
usecols = range1 + range2
file_name = 'path/to/csv/file.csv'
df = pd.read_csv(file_name, usecols=usecols)