本文介绍了网络抓取选项 - 仅限C ++版本的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我在寻找一个用于网页抓取的好的C ++库。
必须是C / C ++和无请勿指示我访问或其他SO问题/答案,其中C ++甚至不
I'm looking for a good C++ library for web scraping.
It has to be C/C++ and nothing else so please do not direct me to Options for HTML scraping or other SO questions/answers where C++ is not even mentioned.
推荐答案
- 下载html文件
- 可转换为有效的xml
- 来解析/导航xml
- libcurl to download the html file
- libtidy to convert to valid xml
- libxml to parse/navigate the xml
这篇关于网络抓取选项 - 仅限C ++版本的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!