Hive的一些常用的高阶开发
内容
1.开窗函数
2.行转列,列转行,多行转一行,一行转多行
3.分组: 增强型group
4.排序
5.关联
本次的内容: 内容1 和内容2,采用的是示例数据以及对应的实现。数据可以直接放在Hive中执行。可以直观的观察数据,进而对函数以及相应的功能有所熟悉。
对于不同的场景的数据计算,了解SQL的基本语法以及一些高阶用法,在这些基础上组合相应的功能。这些都是一些工程上的应用,多练习的。通过构建数据集来验证的方式,是可以自己来确认一些似是而非的语法。对于Hive底层原理和代码的了解也是途径之一。构建数据集验证与通过原理去分析了解的方法可以相互配合使用。最终的目标之一就是更好的实现业务分析目标。-- over() 子句 有order by, 分区内排序后一个个叠-- windows子句 WINDOW子句(灵活控制窗口的子集)
本次分享主要是涉及开窗函数以及行列的一些开发内容。后续的一些内容,也是应用开发中的一些比较常见的要注意和区分的点。
本示例参考了一些网上的资料和书本的内容,由于来源未做标记,如有侵删。