本文介绍了网络抓取选项 - 仅限C ++版本的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我在寻找一个用于网页抓取的好的C ++库。

必须是C / C ++和请勿指示我访问或其他SO问题/答案,其中C ++甚至不

I'm looking for a good C++ library for web scraping.
It has to be C/C++ and nothing else so please do not direct me to Options for HTML scraping or other SO questions/answers where C++ is not even mentioned.

推荐答案


  • 下载html文件

  • 可转换为有效的xml

  • 来解析/导航xml

    • libcurl to download the html file
    • libtidy to convert to valid xml
    • libxml to parse/navigate the xml
    • 这篇关于网络抓取选项 - 仅限C ++版本的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

08-01 04:26