我有一个表A包含一个列表,一个表B包含A中项目的子列表。如何获得一个表C,该表包含一个列表,该列表是BA的补充?
我知道如何用sql来实现。我不知道如何在猪身上接近它。
谢谢。

最佳答案

用猪的话说,你有两个“袋子”A和B,其中B是A的子集。
如果b只包含a中的值,则可以执行c=diff(a,b)。
但是,考虑diff删除了重复项,因此您将得到a中b的补码,并将其还原为唯一值。
一般来说,diff提供了a中b的补语和b中a的补语的并集。

关于database - 在Pig中,查找表中条目的补码,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/12146948/

10-14 05:32