Hive实现WordCount计数

在没学习Hive之前,我们学习MapReduce去实现WordCount计数的时候,就要去编写80多行的java代码,现在我们学习了Hive,我们只需要一行Sql语句就可以实现。

准备数据

Week08_day01 (Hive实现WordCount计数)-LMLPHP

在hive中创建表

Week08_day01 (Hive实现WordCount计数)-LMLPHP

使用本地导入的命令进行导入数据

Week08_day01 (Hive实现WordCount计数)-LMLPHP

select 查看一下

Week08_day01 (Hive实现WordCount计数)-LMLPHP

将每一行数据进行分割

    select split(line,',') from wc;

Week08_day01 (Hive实现WordCount计数)-LMLPHP

将行转为列

    select explode(split(line,',')) from wc;

Week08_day01 (Hive实现WordCount计数)-LMLPHP

将相同的进行分组统计

    select w.word,count(*) from (select explode(split(line,',')) as word from wc) w group by w.word;

Week08_day01 (Hive实现WordCount计数)-LMLPHP

05-28 23:05