这是我的csv文件
id,name,address
"1xz","hari","streetno=1-23-2,street name=Lakehill,town=Washington"
"2xz","giri","streetno=5-6-3456,street name=second street,town=canada"
我使用行格式定界符“”加载了此数据,但未正确加载,我遇到了地址字段问题。在地址字段中,我有这样的数据格式“streetno = 1-23-2,street name = Lakehill,town =华盛顿“在此地址中的值再次由”,“终止。我在 pig 中找到了一种解决方案,请帮助我使用 hive 解决它。
我正在得到这个输出
"1xz" "hari" "streetno=1-23-2
"2xz" "giri" "streetno=5-6-3456
这是我的图式
create table emps (id string,name string,addresss string ) row format delimited fields terminated by ',' lines terminated by '\n' stored as textfile;
最佳答案
使用split()
函数,它返回字符串数组:[0] ='streetno',[1] ='1-23-2':
split(address,'=')[1] as address --returns '1-23-2'
关于csv - 如何将csv文件加载到配置单元中,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/40847831/