2016年1月14日 9:57:23 星期四
背景介绍
Apache Kylin是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开发并贡献至开源社区.
常见的使用方法是将Kylin安装到hadoop的客户端机器上.
在日常使用场景, 上图中的application可以是Kylin的web系统. Kylin的web系统提供web化工具用于创建Cube,执行查询和进行各种管理工作. Kylin的Web系统包含一个用于查询支持的查询引擎和一个用于Cube的构建引擎, 这两个引擎会和Hadoop的组件进行交互,主要是hive和hbase.
环境介绍
Kylin推荐环境:
Hadoop: 2.4 - 2.7
Hive: 0.13 - 0.14
HBase: 0.98 - 0.99
JDK: 1.7+
我使用的环境:
Hadoop: cloudera 5.4.5, 包含MR, hive ,hbase组件
Kylin: Apache Kylin v1.2
安装配置
1 从Kylin的站点下载页面http://kylin.apache.org/download/ 获取最新的安装包(v1.2)
2 将安装包解压到相应目录,并设置$KYLIN_HOME指向该目录
3 确保你用于运行kylin的用户拥有在shell中运行hadoop,hive和hbase的权限. 如果你无法确认, 请运行 bin目录下的check-env.sh来进行检查, 如果你的环境存在问题, 检查结果会打印出详细信息, 以便于你定位问题.
4 如果需要定制化,请修改$KYLIN_HOME/conf/kylin.properties中的相应配置项
5 运行bin/kylin.sh start 来启动kylin
6 如果需要停止kylin, 运行 bin/kylin.sh stop
7 访问http://hostname:7070/kylin 以访问Kylin Web App