请让我知道是否可以将特定的关系字段加载到另一个字段中,如下所示
usergroup = GROUP input BY user;
output = FOREACH usergroup {
intermediate = input.traid;
distinctdata = DISTINCT intermediate;
GENERATE group as user,count(distinctdata); };
最佳答案
您不能将特定的关系字段加载到另一个字段中。
根据我的理解,您想区分input.traid
的值,然后对其进行计数。
在这里,您始终会为每个用户获得1
的count(distinctdata)
。为什么要将此作为输出?DISTINCT
在特定的列(字段)上不起作用,但用于元组(行)。
它删除重复的元组。
关于hadoop - 如何将数据传递到 pig 的关系,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/24108043/