我想读取服务器中的bz2文件,将其解压缩并使用csv解析器读取,但是仍然出现错误;

    myfile = bz2.BZ2File(bio.read(), "rb")
TypeError: file() argument 1 must be encoded string without NULL bytes, not str

import paramiko
from config import config
import bz2
import csv
import StringIO
from io import BytesIO
ssh = paramiko.SSHClient()
ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())
ssh.connect(config.get('mrc_ssh', 'host'), username=config.get('mrc_ssh', 'user'))
sftp_client = ssh.open_sftp()
_file = sftp_client.open('/home/myfile.bz2')
bio = BytesIO(_file.read())
print bio
myfile = bz2.BZ2File(bio.read(), "rb")
reader = csv.DictReader(myfile)
for row in reader:
    print row

最佳答案

bz2.BZ2File将文件名作为第一个参数。不是实际数据。

两种使用方式(如果可以在本地存储文件):

myfile = bz2.BZ2File('/home/myfile.bz2', "rb")


或使用单次解压功能bz2.decompress

uncompressed_data = bz2.decompress(bio.read())

关于python - 从BytesIO解压缩bz2文件,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/29236161/

10-12 22:58