想象以下名为id的列:

68
69
43
54
56
61
69
70
71
72
77
78
79
85
87
88
89
93
95
96
98
99
99
62
66

如果我执行以下操作:percentile(id, 0.9),则输出为97.2。到底是怎么回事?

最佳答案

如果您输入0.9,则您期望提供给该函数的数据的90%将低于返回值。 25的90%大约是22.5,而97.2可能是正确的答案,因为四个最高值是您的集合中的99 99 98 96,而97.2在22号(96)和23号(98)之间。

关于hadoop - 百分位数功能在Hive中如何工作?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/41735013/

10-11 09:10