请让我知道是否可以将特定的关系字段加载到另一个字段中,如下所示

usergroup = GROUP input BY user;

output = FOREACH usergroup {
                intermediate = input.traid;
                distinctdata = DISTINCT intermediate;

        GENERATE group as user,count(distinctdata); };

最佳答案

您不能将特定的关系字段加载到另一个字段中。

根据我的理解,您想区分input.traid的值,然后对其进行计数。

在这里,您始终会为每个用户获得1count(distinctdata)。为什么要将此作为输出?
DISTINCT在特定的列(字段)上不起作用,但用于元组(行)。

它删除重复的元组。

关于hadoop - 如何将数据传递到 pig 的关系,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/24108043/

10-08 23:34