我如何在Hive中做到这一点?

    columnA       columnB    columnC
     100.10      50.60       30
     100.10      50.60       30
     100.10      50.60       20
     100.10      70.80       40

输出应为:
  columnA   columnB    No_of_distinct_colC
  100.10    50.60       2
  100.10    70.80       1

我认为是正确的查询:
SELECT columnA,columnB,COUNT(distinct column C)
from table_name
group by columnA,columnB

这样对吗? SQL也很好。

更新:如何找到columnC的标准偏差?需要这个尽快。

最佳答案

是的,这几乎是正确的。但是,您有一个简单的错误。您的列名在COUNT内是错误的。

SELECT columnA,columnB,COUNT(DISTINCT columnC) No_of_distinct_colC
from table_name
group by columnA,columnB

关于SQL/Hive计数不同的列,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/18091965/

10-14 18:54