我正在尝试使用Beautifulsoup解析RSS/Podcast提要,除了我似乎无法解析pubDate字段外,其他一切都运行良好。
data = urllib2.urlopen("http://www.democracynow.org/podcast.xml")
dom = BeautifulStoneSoup(data, fromEncoding='utf-8')
items = dom.findAll('item');
for item in items:
title = item.find('title').string.strip()
pubDate = item.find('pubDate').string.strip()
标题被解析得很好,但是当它到达pubDate时,它会说:
回溯(最近一次呼叫时间):
文件“”,第2行,在
AttributeError:“NoneType”对象没有属性“string”
但是,当我下载XML文件的副本并将“pubDate”重命名为其他文件,然后再次解析它时,它似乎可以工作。pubDate是Python中的一个保留变量还是什么?
谢谢,
克
最佳答案
它与item.find('pubdate').string.strip()
一起工作。
为什么不使用feedparser?
关于python - pubDate RSS使用Beautifulsoup/Python解析异常,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/2168516/