所以我有一个来自google docs的.txt文件,其中包含一些来自david foster wallace的“遗忘”行。使用:
with open("oblivion.txt", "r", 0) as bookFile:
wordList = []
for line in bookFile:
wordList.append(line)
返回并打印我得到的单词表:
"surgery on the crow\xe2\x80\x99s feet around her eyes."
(它截断了大量文本)。但是,如果不附加单词表,我只是
for line in bookFile:
print line
一切都很好!对文件的.read()也是如此-得到的str没有疯狂的字节表示,但是我不能按我想要的方式操作它。
我在哪里.encode()或.decode()或什么?使用python 2是因为3给了我一些I/O缓冲区错误。谢谢。
最佳答案
尝试将open
作为encoding
使用:
with open("oblivion.txt", "r", encoding='utf-8') as bookFile:
wordList = bookFile.readlines()