您可以帮助我更改文件的结构吗?
例如:
1;2,3,4;2
1;2;2
1;3;2
1;4;2
最佳答案
pig 脚本:
A = LOAD 'a.csv' USING PigStorage(';') AS (value1:chararray,value2:chararray,value3:chararray);
B = FOREACH A GENERATE value1, FLATTEN(TOKENIZE(value2, ',')), value3;
DUMP B;
输入:
1;2,3,4;2
输出:
(1,2,2)
(1,3,2)
(1,4,2)
我们可以使用存储B;作为分隔符。
STORE B INTO 'requiredOutputLocation' USING PigStorage(';');
关于hadoop - Hadoop pig 。不断变化的结构,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/31279210/