我需要一个库(希望是在 C# 中!)它可以作为网络爬虫来访问 HTTP 文件和 FTP 文件。原则上,我对阅读 HTML 感到满意,我想将其扩展为 PDF、WORD 等。

我对初学者的开源软件或至少任何文档说明感到满意。

最佳答案

检查 NCrawler 项目

关于C# web 和 ftp 爬虫库,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/3962250/

10-13 06:03