有什么方法可以将网页中的文本写到文本文档中? (.txt)我今天开始使用Jsoup尝试执行此操作,但似乎并不是我要找的(或我认为)。因此,如果可以通过Jsoup或其他方式实现此目的,请告诉我。谢谢。

最佳答案

JSoup允许您以string的形式访问响应的正文,因此您可以执行response.body()并使用普通的PrintWriter或您喜欢的任何东西编写它。

JSoup主要用于从站点提取实体,因此,如果这是您需要做的,那么也许您可以使用一个更简单的库-通常,将抓取与解析分开进行并行化非常有用。 Apache HttpClient是一个非常流行的库,用于执行HTTP请求,您可以按照此example的形式将响应实体作为字符串获取并写入它

您需要协商SSL连接或传递任何cookie吗?如果是这样,HttpClient提供了很多不错的features

Jetty HttpClient是另一种选择,或者甚至可以卷曲url> filename。

关于java - 将网页写入文本文档,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/32491654/

10-12 00:24
查看更多