textfile格式,数据以文本格式存储,其中字段由字段定界符分隔。这就是为什么我们更喜欢像CTRL ^ A这样的不可读分隔符。

但是在rcfileorcavrosequencefile中创建配置单元表时使用字段定界符有什么效果?

在一些配置单元教程中,我也看到了在这些二进制文件格式中使用定界符。

例:
create table olympic_orcfile(athelete STRING,age INT,country STRING,year STRING,closing STRING,sport STRING,gold INT,silver INT,bronze INT,total INT) row format delimited fields terminated by '\t' stored as orcfile;
Hive中的字段分隔符是否被忽略或对二进制文件格式有影响?

最佳答案

被RCFILE,ORC和AVRO忽略,但对SEQUENCEFILE确实重要。

关于hadoop - Hive中的二进制文件格式字段分隔符重要吗?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/44224543/

10-10 17:00
查看更多