看来http://portland.beerandblog.com/feed/atom/搞砸了(0.92和2.0 RSS提要也是如此)。
通用Feed解析器(http://code.google.com/p/feedparser/source/browse/trunk/feedparser/feedparser.py?spec=svn295&r=295的最新版本)看不到任何日期。
<title>Beer and Blog Portland</title>
<atom:link href="http://portland.beerandblog.com/feed/" rel="self" type="application/rss+xml" />
<link>http://portland.beerandblog.com</link>
<description>Bloggers helping bloggers over beers in Portland, Oregon</description>
<pubDate>Fri, 19 Jun 2009 22:54:57 +0000</pubDate>
<generator>http://wordpress.org/?v=2.7.1</generator>
<language>en</language>
<sy:updatePeriod>hourly</sy:updatePeriod>
<sy:updateFrequency>1</sy:updateFrequency>
<item>
<title>Widmer is sponsoring our beer for the After Party!!</title>
<link>http://portland.beerandblog.com/2009/06/19/widmer-is-sponsoring-our-beer-for-the-after-party/</link>
<comments>http://portland.beerandblog.com/2009/06/19/widmer-is-sponsoring-our-beer-for-the-after-party/#comments</comments>
<pubDate>Fri, 19 Jun 2009 22:30:35 +0000</pubDate>
<dc:creator>Justin Kistner</dc:creator>
<category><![CDATA[beer]]></category>
我尝试着
尝试:
已发布= e.published_parsed
除:
尝试:
已发布= e.updated_parsed
除:
已发布= e.created_parsed
失败了,因为我找不到约会。
关于如何合理提取日期的任何想法?
谢谢!
最佳答案
为我工作:
>>> e = feedparser.parse('http://portland.beerandblog.com/feed/atom/')
>>> e.feed.date
u'2009-06-19T22:54:57Z'
>>> e.feed.date_parsed
(2009, 6, 19, 22, 54, 57, 4, 170, 0)
>>> e.feed.updated_parsed
(2009, 6, 19, 22, 54, 57, 4, 170, 0)
也许您正在寻找
e.updated_parsed
,而应该在哪里寻找e.feed.updated_parsed
?