大数据查询引擎的选型,画了几张架构图,和一些对比分析:

一、Presto

presto .vs impala .vs HAWQ query engine-LMLPHP

presto .vs impala .vs HAWQ query engine-LMLPHP

二、Impala

presto .vs impala .vs HAWQ query engine-LMLPHP

三、HAWQ

presto .vs impala .vs HAWQ query engine-LMLPHP

四、总体比较:

presto .vs impala .vs HAWQ query engine-LMLPHP

1)都是MPP架构,且没有明显性能差距
2)HAWQ的功能、特性较Presto和Impala更全面,同时带来系统配置复杂,学习维护成本高的风险
3)Presto与Impala都有各自明显的优势:

1,Presto可以通过Connector接入多种数据源,灵活性高,而Impala只支持有限的数据源类型
2,Impala天然支持Coordinator高可用,Presto的Coordinator存在单点故障,需人工参与恢复
3,Impala更容易在现有CDH环境部署、集成

目前使用Hive痛点问题是慢
在满足速度快的条件下,替代方案的稳定性、易用性、易维护性优先考虑,

05-11 20:07