举一个简单的例子
select * from tablename;
不会踢 map 减少,而
select count(*) from tablename;
做。决定何时使用map reduce(通过配置单元)的一般原则是什么?
最佳答案
通常,任何类型的聚合(例如最小/最大/计数)都需要MapReduce作业。可能不会为您解释所有内容。
Hive具有许多RDBMS样式,具有 EXPLAIN
关键字,它将概述如何将Hive查询转换为MapReduce作业。尝试在两个示例查询上运行解释,然后查看其在幕后试图做什么。