我正在尝试从网站解析数据,但出现错误。
这是我的python代码

import urllib.request
import re

url = "http://ihned.cz"

req = urllib.request.Request(url)
resp = urllib.request.urlopen(req)
respData = resp.read().decode('utf-8')
#print(respData) #html kód

authors = re.findall(r'data-author="(.*?)"', str(respData))

for author in authors:
    print(authors)


这是错误。

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe1 in position 368: invalid continuation byte


你能帮我么?
谢谢。

最佳答案

该网站的消息来源为charset="windows-1250"。尝试decode('windows-1250')

关于python - 通过utf-8从网站解析的数据中解码,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/44157162/

10-12 07:11