我有一个来自dati.istat.it的gz file
如果我用7zip解压,我很容易用这个代码加载pd.read_csv("DCCV_OCCUPATIT_Data+FootnotesLegend_175b2401-3654-4673-9e60-b300989088bb.csv", sep="|", engine = "python")
我怎么能不带7拉链的拉链呢?
太多了!
最佳答案
您可以使用libraryzipfile
:
import pandas as pd
import zipfile
z = zipfile.ZipFile('test/file.gz')
print pd.read_csv(z.open("DCCV_OCCUPATIT_Data+FootnotesLegend_175b2401-3654-4673-9e60-b300989088bb.csv"),
sep="|",
engine = "python")
熊猫只支持
gzip
和bz2
inread_csv
:压缩:'gzip'、'bz2'、'infer'、none,默认为'infer'
用于动态解压缩磁盘上的数据。如果filePath_或_buffer是分别以“.gz”或“.bz2”结尾的字符串,则使用gzip或bz2,否则不进行解压缩。设置为“无”表示无解压缩。