我有一个包含以下内容的文件

1,2,3|4,5,6

第一个分隔符是“|”下一个分隔符是','。

我希望我的输出以以下格式显示
1
2
3
4
5
6

您知道可用于此的任何 pig 拉丁脚本吗?

谢谢,

问候,
Dheeraj Rampally。

最佳答案

没关系,我得到了答案。

A = load 'abc.txt';
B = foreach A generate FLATTEN(STRSPLIT($0,'\\|'));
C = foreach B generate FLATTEN(TOBAG(*));
store C into 'def';

A1 = load 'def';
B1 = foreach A1 generate FLATTEN(STRSPLIT($0,'\\,'));
C1 = foreach B1 generate FLATTEN(TOBAG(*));
store C1 into 'ghi';

给了我解决方案。

谢谢,

问候,
Dheeraj Rampally。

关于hadoop - 在Pig Latin中使用TOBAG和STRSPLIT,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/19580442/

10-16 01:25