pip install chardet

执行

import chardet

f = open('a.doc',r)

data = f.read()

print chardet.detect(data)

结果

{'confidence': 0.64465744, 'encoding': 'utf-8'}

前面是相似度  后面是编码格式

或者 return chardet.detect(data).get("encoding") 直接获取文件编码格式

05-11 13:04