Hive的一些常用的高阶开发

内容
   1.开窗函数
   2.行转列,列转行,多行转一行,一行转多行
   3.分组: 增强型group
  4.排序
  5.关联

本次的内容: 内容1 和内容2,采用的是示例数据以及对应的实现。数据可以直接放在Hive中执行。可以直观的观察数据,进而对函数以及相应的功能有所熟悉。

  对于不同的场景的数据计算,了解SQL的基本语法以及一些高阶用法,在这些基础上组合相应的功能。这些都是一些工程上的应用,多练习的。通过构建数据集来验证的方式,是可以自己来确认一些似是而非的语法。对于Hive底层原理和代码的了解也是途径之一。构建数据集验证与通过原理去分析了解的方法可以相互配合使用。最终的目标之一就是更好的实现业务分析目标。-- over() 子句 有order by, 分区内排序后一个个叠-- windows子句 WINDOW子句(灵活控制窗口的子集)

本次分享主要是涉及开窗函数以及行列的一些开发内容。后续的一些内容,也是应用开发中的一些比较常见的要注意和区分的点。

本示例参考了一些网上的资料和书本的内容,由于来源未做标记,如有侵删。

09-08 04:57
查看更多