由于bz2是可拆分的,并且可以节省空间,因此我计划以bzip2格式存储表数据。
但是,似乎无法识别压缩格式。 gzip格式很好。
我使用的代码如下所示:

CREATE TABLE IF NOT EXISTS image_bzip (
    image_id STRING,
    image_feature STRING,
    other_stuff STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE LOCATION '/hivestore/bzip';

LOAD DATA LOCAL INPATH '/nfs/directory/*.bz2' OVERWRITE INTO TABLE image_bzip;

有人可以指出我所缺少的吗?

谢谢。

最佳答案

如果我们正确设置压缩编解码器,它自然会工作。

08-25 03:52