我正在尝试开始我的第一次爬网,已经配置了数据库设置,并执行以下命令:bin/nutch inject urls

错误结果如下:

InjectorJob: starting at 2014-07-18 08:13:34
InjectorJob: Injecting urlDir: urls
InjectorJob: Using class org.apache.gora.sql.store.SqlStore as the Gora storage class.
InjectorJob: java.lang.RuntimeException: job failed: name=inject urls, jobid=job_local1172062909_0001
        at org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:54)
        at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:233)
        at org.apache.nutch.crawl.InjectorJob.inject(InjectorJob.java:251)
        at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:273)
        at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
        at org.apache.nutch.crawl.InjectorJob.main(InjectorJob.java:282)


有人能帮我吗?

最佳答案

托马斯

您正在使用哪个版本的Gora? SqlStore仅在Gora 0.1上启用,现在是要实施的缺少功能。对不起,这个坏消息:(我认为由于某些许可证问题,删除了sql模块...我认为。

很抱歉这个坏消息:(总有一天该模块肯定会回来的。

关于java - 使用Apache Nuch 2.2.1,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/24824844/

10-12 04:59