我正在使用基于RhipeHadoop进行一些数据分析,但是rhput()函数似乎无法正常工作。

library(Rhipe)
Loading required package: codetools
Loading required package: rJava
------------------------------------------------
| Please call rhinit() else RHIPE will not run |
------------------------------------------------

rhinit()
Rhipe: Using Rhipe.jar file
Initializing Rhipe v0.75.1
2015-10-14 19:07:38,429 WARN  [main][NativeCodeLoader] Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Initializing mapfile caches
rhput('/home/hadoop/downloads/user.txt','/RHIPE/input/')

然后,我发现“/ RHIPE / input /”位于本地根目录下,而不是hdfs目录下:
system("ls /")
app  bin  boot  dev  etc  home  initrd.img  lib  lib64  lost+found
media  mnt  opt  proc  RHIPE  root  run  sbin  srv  sys  tmp  usr  var
vmlinuz

HDFS下没有'/ RHIPE / input'。

最佳答案

我得到了答案,必须将HADOOP_CONF_DIR设置为hadoop的core-site.xml和其他* -site.xml文件所在的目录。

09-11 18:04