我正在使用 feedparser 来获取 RSS 数据。
这是我的代码:

>>> import datetime
>>> import time
>>> import feedparser

>>> d=feedparser.parse("http://.../rss.xml")

>>> datetimee_rss = d.entries[0].published_parsed

>>> datetimee_rss
time.struct_time(tm_year=2015, tm_mon=5, tm_mday=8, tm_hour=16, tm_min=57, tm_sec=39, tm_wday=4, tm_yday=128, tm_isdst=0)

>>> datetime.datetime.fromtimestamp(time.mktime(datetimee_rss))
datetime.datetime(2015, 5, 8, 17, 57, 39)

在我的时区 (FR) 中,实际日期是 May, 8th, 2015 18:57

在 RSS XML 中,值为 <pubDate>Fri, 08 May 2015 18:57:39 +0200</pubDate>
当我将其解析为日期时间时,我得到了 2015, 5, 8, 17, 57, 39

如何让 2015, 5, 8, 18, 57, 39 没有肮脏的黑客,而只需配置正确的时区?

编辑:

通过做 :
>>> from pytz import timezone

>>> datetime.datetime.fromtimestamp(time.mktime(datetimee_rss),tz=timezone('Euro
pe/Paris'))
datetime.datetime(2015, 5, 8, 17, 57, 39, tzinfo=<DstTzInfo 'Europe/Paris' CEST+2:00:00 DST>)

我得到了更好的东西,但是,它似乎在脚本的其余部分不起作用,我遇到了很多 TypeError: can't compare offset-naive and offset-aware datetimes 错误。

最佳答案

feedparser 确实提供了原始日期时间字符串(只需从属性名称中删除 _parsed 后缀),因此如果您知道字符串的格式,则可以自己将其解析为 tz-aware datetime 对象。

例如,使用您的代码,您可以获得 tz-aware 对象,如下所示:

datetime.datetime.strptime(d.entries[0].published, '%a, %d %b %Y %H:%M:%S %z')

有关 strptime() 的更多引用,请参阅 https://docs.python.org/2/library/datetime.html#strftime-and-strptime-behavior

编辑:由于 Python 2.x 不支持 %z 指令,请改用 python-dateutil
pip install python-dateutil

然后
from dateutil import parser
datetime_rss = parser.parse(d.entries[0].published)

https://dateutil.readthedocs.org/en/latest/ 上的文档

关于python - 具有正确的时区和正确的日期时间,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/30130588/

10-12 21:37