我需要一个库(希望是在 C# 中!)它可以作为网络爬虫来访问 HTTP 文件和 FTP 文件。原则上,我对阅读 HTML 感到满意,我想将其扩展为 PDF、WORD 等。
我对初学者的开源软件或至少任何文档说明感到满意。
最佳答案
检查 NCrawler 项目
关于C# web 和 ftp 爬虫库,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/3962250/
我需要一个库(希望是在 C# 中!)它可以作为网络爬虫来访问 HTTP 文件和 FTP 文件。原则上,我对阅读 HTML 感到满意,我想将其扩展为 PDF、WORD 等。
我对初学者的开源软件或至少任何文档说明感到满意。
最佳答案
检查 NCrawler 项目
关于C# web 和 ftp 爬虫库,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/3962250/