有人可以帮助我如何计算一个列的总和,直到达到某个值。用例:占总收入50%的顶级产品。
有没有像piggybank这样的图书馆可以完成它,我在piggybank中找不到它。
我正在尝试实现UDF,但我担心的是:(。
这里的数据结构看起来像-
productId,totalProfitByProduct,totalProfitByCompany,totalRevenueOfCompany。
数据在totalProfitByProduct上按降序排列。
totalProfitByCompany,totalRevenueOfCompany每行都保持不变。
现在,我想从顶部开始将上述总和应用于以上每个产品的totalProfitByProduct上,并获得产生了totalProfitByCompany或totalRevenueOfCompany的50%以上的顶部产品
最佳答案
储钱有百分位UDf,可用于您的需求。
Pig Script和udf可以帮助您实现它。