我想建立一个解析器,用于解析xml文档的多个页面。这些页面包括图像和其他媒体,这些图像和其他媒体由额外的静态资产服务器提供。现在我的问题是:

我应该使用rails来解析文档还是制作一个特殊的节点服务器?由于性能,我想到了节点。

解析器从xml文件中创建一个html文档。

提前致谢!

编辑:这些html页面可从多个用户查看。

最佳答案

我认为,如果您可以使用ruby解析每秒10万个页面或使用node.js解析每秒20万个页面,那没有太大的区别,除非您要解析数十亿个xml文档(我把这些数字加起来了)。您应该使用最熟悉的工具。

但是,在node.js中有一些很酷的用于Web抓取/解析的库


You can use jQuery with node.js!
node.io - web scraper module, supports jquery, distributed processing, modules and more
another node.js web scraper module - fetch pages in parallel, add rate limiting

10-06 14:21
查看更多