本文介绍了Nutch的喷油器后爬行停止。的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
这是我的cygwin的屏幕看起来...
cygpath:不能转换空路径
喷油器:开始于2014年5月15日十六点57分50秒
喷油器:crawlDb:-dir / crawldb
喷油器:urlDir:网址
喷油器:转换注入的网址抓取数据库条目。
修补程序HADOOP-7682:解决方法实例化文件系统
喷油器:由过滤器拒绝的网址总数:1
喷油器:规范化和过滤后,注入的网址总数:0
注射:注射合并到的URL抓取分贝。
喷油器:覆盖:假的
喷油器:更新时间:假的
喷油器:收于2014年5月15日16时57分52秒,经过:00:00:02
解决方案
注入的网址总数为0,即没有什么抓取。
喷油器:由过滤器拒绝的网址总数:1
喷油器:规范化和过滤后,注入的网址总数:0
here is my cygwin screen looks...
cygpath: can't convert empty path
Injector: starting at 2014-05-15 16:57:50
Injector: crawlDb: -dir/crawldb
Injector: urlDir: urls
Injector: Converting injected urls to crawl db entries.
Patch for HADOOP-7682: Instantiating workaround file system
Injector: total number of urls rejected by filters: 1
Injector: total number of urls injected after normalization and filtering: 0
Injector: Merging injected urls into crawl db.
Injector: overwrite: false
Injector: update: false
Injector: finished at 2014-05-15 16:57:52, elapsed: 00:00:02
解决方案
Total number of urls injected is 0. That is nothing to crawl.
Injector: total number of urls rejected by filters: 1
Injector: total number of urls injected after normalization and filtering: 0
这篇关于Nutch的喷油器后爬行停止。的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!