问题
- 今天在测试环境上跑任务的时候遇到了这个问题,找遍了网上的文章,都是让改配置文件的,比如这一个 Retrying connect to server ,但是在测试环境上我没有权限改配置文件,所以也就没有测试
解决方案
- 之前的运行语句和jar包都是可以正常跑出结果的,这次也是在之前的jar包基础上做了一些修改,为什么就不能跑了呢?
- 之后用控制变量法测试了很多参数,发现之前的跑的数据比这次小,之前5.4T,这次16T,于是将这次的数据分批次跑,减少一次跑的数据量,成功运行
总结
- 出现这个错误的原因是数据量太大,导致hadoop出现连接错误
- 改配置文件的方法没有试过,因为没有权限
- 我的解决方案是写了个脚本分批次跑数据,减少一次跑的数据量