我正在尝试建立一个小的Android应用程序,该应用程序使用Goose库从网页中提取内容。由于该库是用Scala编写的,因此我使用的是发现here的.jar。问题是,当我尝试从页面提取内容时,它什么也不返回。我使用所需的URL成功创建了Article
对象,但是对象的值(标题,域,topImage等)均为null
。我尝试使用不同的URL,以查看问题是否仅存在于单个网站上,但事实并非如此。
我用来设置Goose
实例的代码是这样的:
gooseDir = context.getCacheDir();
Configuration config = new Configuration();
config.setLocalStoragePath(gooseDir.getAbsolutePath());
Goose goose = new Goose(config);
然后,我像这样创建
Article
实例:Article article = goose.extractContent(url);
有什么建议吗?
最佳答案
实际上,由于不兼容,您不能在Android上使用Goose库,但是您可以使用我的Android版本:https://github.com/milosmns/goose
它的功能几乎与Goose相同,只能在Android上很好地工作。