我正在尝试建立一个小的Android应用程序,该应用程序使用Goose库从网页中提取内容。由于该库是用Scala编写的,因此我使用的是发现here的.jar。问题是,当我尝试从页面提取内容时,它什么也不返回。我使用所需的URL成功创建了Article对象,但是对象的值(标题,域,topImage等)均为null。我尝试使用不同的URL,以查看问题是否仅存在于单个网站上,但事实并非如此。

我用来设置Goose实例的代码是这样的:

gooseDir = context.getCacheDir();
Configuration config = new Configuration();
config.setLocalStoragePath(gooseDir.getAbsolutePath());
Goose goose = new Goose(config);


然后,我像这样创建Article实例:

Article article = goose.extractContent(url);


有什么建议吗?

最佳答案

实际上,由于不兼容,您不能在Android上使用Goose库,但是您可以使用我的Android版本:https://github.com/milosmns/goose

它的功能几乎与Goose相同,只能在Android上很好地工作。

08-28 14:17