我在 hive 中有一张桌子,包括
questionid,questiontag,answerID,userIDofanswerer
我需要此数据集中的十大最常用标签。我试过了 :
select count(questionID),questiontag from table GROUP BY tags;
但是我如何通过Count(questionID)
订购 最佳答案
在ORDER BY cnt DESC LIMIT 10
下面的查询中,将选择前10个最常用的标签:
SELECT count(questionID) cnt ,
questiontag
FROM table
GROUP BY questiontag
ORDER BY cnt DESC
LIMIT 10;
count(*)
将计算包括NULL QuestionID在内的所有行count(questionID)
将仅对问题ID不为NULL的行进行计数关于hadoop - 在 hive mapreduce中计算desc,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/39753845/