由于bz2是可拆分的,并且可以节省空间,因此我计划以bzip2格式存储表数据。
但是,似乎无法识别压缩格式。 gzip格式很好。
我使用的代码如下所示:
CREATE TABLE IF NOT EXISTS image_bzip (
image_id STRING,
image_feature STRING,
other_stuff STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE LOCATION '/hivestore/bzip';
LOAD DATA LOCAL INPATH '/nfs/directory/*.bz2' OVERWRITE INTO TABLE image_bzip;
有人可以指出我所缺少的吗?
谢谢。
最佳答案
如果我们正确设置压缩编解码器,它自然会工作。