本文介绍了如何解析“<media:group>"使用feedparser?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
rss 文件如下所示,我想获取 media:group 部分中的内容.我查看了 feedparser 的文档,但似乎没有提到这一点.怎么做?任何帮助表示赞赏.
<title>XYZ InfoX:特别问候</title><link>http://www1.XYZInfoX.com/learninghello/home</link><description>你好</description><language>en</language><版权/><pubDate>2010 年 3 月 17 日星期三 08:50:06 GMT</pubDate><dc:creator/><dc:date>2010-03-17T08:50:06Z</dc:date><dc:language>en</dc:language><dc:权限/><title>美国之音</title><link>http://www1.XYZInfoX.com/learninghello</link><url>http://media.XYZInfoX.com/designimages/XYZRSSIcon.gif</url></图像><项目><title>谁是狂野西部最致命的枪手?</title><link>http://www1.XYZInfoX.com/learninghello/home/Deadliest-Gunmen-of-the-Wild-West-87826807.html</link><说明>他们两个的故事:杀戮"吉姆米勒是一个不法之徒,德克萨斯"约翰斯劳特是一个法律人|探索 </description><pubDate>2010 年 3 月 17 日星期三 00:38:48 GMT</pubDate><guid isPermaLink="false">87826807</guid><dc:creator></dc:creator><dc:date>2010-03-17T00:38:48Z</dc:date><media:content url="http://media.XYZInfoX.com/images/archives_peace_comm_480_16mar_se.jpg" medium="image" isDefault="true" height="300" width="480"/><media:content url="http://media.XYZInfoX.com/images/archives_peace_comm_230_16mar_se_edited-1.jpg" medium="image" isDefault="false" height="230" width="230"/><media:content url="http://media.XYZInfoX.com/images/tex_trans_lawmans_230_16mar10_se.jpg" medium="image" isDefault="false" height="230" width="230"/><media:content url="http://www.XYZInfoX.com/MediaAssets2/learninghello/dalet/se-exp-outlaws-part2-17mar2010.Mp3" type="audio/mpeg" medium="audio" isDefault=假"/></media:group></项目>
解决方案
来自 PyPi 的 feedparser 4.1 有这个错误.
我的解决方案是从存储库中获取最新的 feedparser.py (4.2 pre).
svn checkout http://feedparser.googlecode.com/svn/trunk/feedparser-readonlycd feedparser-只读python setup.py 安装
现在您可以访问所有 Mrss 项目
>>>import feedparser # 新版本!>>>d = feedparser.parse(MY_应该为你做这项工作
The rss file is shown as below, i want to get the content in section media:group . I check the document of feedparser, but it seems not mention this. How to do it? Any help is appreciated.
<?
解决方案
feedparser 4.1 as available from PyPi has this bug.
the solution for me was to get the latest feedparser.py (4.2 pre) from the repository.
svn checkout http://feedparser.googlecode.com/svn/trunk/ feedparser-readonly
cd feedparser-readonly
python setup.py install
now you can access all mrss items
>>> import feedparser # the new version!
>>> d = feedparser.parse(MY_
should do the job for you
这篇关于如何解析“<media:group>"使用feedparser?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!