我使用以下技术的以下版本安装了Apache kylin:-

Apache Hadoop: - 2.7.3
Apache Hive: - 2.1.0
Apache Hbase:- 1.2.4
Apache Kylin: - 1.6

我可以使用安装程序提供的sample.sh文件在Apache Kylin中加载数据。但是,当我尝试在某个时间范围内构建多维数据集时,在“构建多维数据集”过程的步骤3中出现以下错误
File does not exist:
hdfs://localhost:54310/app/hadoop/tmp/mapred/staging/hduser341814501/.staging/job_local341814501_0007/libjars/hive-exec-2.1.0.jar

其中hduser是已启动kylin并尝试构建多维数据集的用户。

我检查了目录结构,发现app/hadoop/tmp/mapred/staging/hduser341814501/.staging folder中没有目录或文件。

kylin是否尝试创建此目录结构并将hive-exec-2.1.0.jar放在该目录结构中,由于某些权限问题而无法这样做?

还是由于其他错误而来?

虽然,麒麟要查找的 jar 存在于hdfs://localhost:54310/usr/local//hivr/lib folder中。麒麟是否有可能在错误的位置寻找 jar ?

谁能帮我解决我的错?

最佳答案

Kylin将从类路径中搜索配置单元,然后在提交MR作业时使用“tmpjars”属性指定配置单元。请使用以下方法检查您的环境:

1)运行$ KYLIN_HOME / bin / find-hive-dependency.sh,检查输出;

2)在$ KYLIN_HOME / logs / kylin.log中搜索“过滤后的Hive依赖关系”,它应该记录提交到Hadoop作业的依赖jar,例如:

logs/kylin.log.2017-03-07:2017-03-07 11:58:18,772 INFO  [pool-6-thread-16] common.AbstractHadoopJob:203 : Hive Dependencies After Filtered: /usr/hdp/2.5.4.0-121/hive/lib/hive-metastore-1.2.1000.2.5.4.0-121.jar,/usr/hdp/2.5.4.0-121/hive/lib/hive-exec-1.2.1000.2.5.4.0-121.jar,/usr/hdp/2.5.4.0-121/hive-hcatalog/share/hcatalog/hive-hcatalog-core-1.2.1000.2.5.4.0-121.jar

另外,请检查Kylin运行的计算机上是否存在jar。

关于java - 获取java.io.FileNotFoundException:文件不存在:尝试为Apache Kylin中的示例数据构建多维数据集时出现hive-exec-2.1.0.jar错误,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/41032149/

10-11 08:32