我有一个来自dati.istat.it的gz file
如果我用7zip解压,我很容易用这个代码加载
pd.read_csv("DCCV_OCCUPATIT_Data+FootnotesLegend_175b2401-3654-4673-9e60-b300989088bb.csv", sep="|", engine = "python")
我怎么能不带7拉链的拉链呢?
太多了!

最佳答案

您可以使用libraryzipfile

import pandas as pd
import zipfile

z = zipfile.ZipFile('test/file.gz')
print pd.read_csv(z.open("DCCV_OCCUPATIT_Data+FootnotesLegend_175b2401-3654-4673-9e60-b300989088bb.csv"),
                  sep="|",
                  engine = "python")

熊猫只支持gzipbz2inread_csv
压缩:'gzip'、'bz2'、'infer'、none,默认为'infer'
用于动态解压缩磁盘上的数据。如果filePath_或_buffer是分别以“.gz”或“.bz2”结尾的字符串,则使用gzip或bz2,否则不进行解压缩。设置为“无”表示无解压缩。

08-16 02:51