嗨,我正在使用Pig从数组中提取数据!完全来自一个元组(nom_d_hote)!
数据会像
DCL-GUETTACHE.engtp.dz
DCL-GUETTACHE.engtp.dz
DG-MESLOUB.engtp.dz
DG-MESLOUB.engtp.dz
DG-MESLOUB.engtp.dz
该représenteDirection-name-engtp.dz,我想使用正则表达式提取名称,仅提取名称
你能给我看看正则表达式如何与 pig 一起工作的例子吗,我该怎么做?
最佳答案
假设关系A中的字段名称为f1,您可以像这样从关系A中的f1提取名称。
获取-和。(转义点)之间的所有内容(。*)。
NAME = FOREACH A GENERATE REGEX_EXTRACT_ALL(A.f1,'-(.*)\\.)') as name;