我想建立一个解析器,用于解析xml文档的多个页面。这些页面包括图像和其他媒体,这些图像和其他媒体由额外的静态资产服务器提供。现在我的问题是:
我应该使用rails来解析文档还是制作一个特殊的节点服务器?由于性能,我想到了节点。
解析器从xml文件中创建一个html文档。
提前致谢!
编辑:这些html页面可从多个用户查看。
最佳答案
我认为,如果您可以使用ruby解析每秒10万个页面或使用node.js解析每秒20万个页面,那没有太大的区别,除非您要解析数十亿个xml文档(我把这些数字加起来了)。您应该使用最熟悉的工具。
但是,在node.js中有一些很酷的用于Web抓取/解析的库
You can use jQuery with node.js!
node.io - web scraper module, supports jquery, distributed processing, modules and more
another node.js web scraper module - fetch pages in parallel, add rate limiting