问题描述
在后,我真的很想使用它。
我启动了启用了LLAP的Azure HDinsight群集。但是,它似乎没有比普通的Hive更好的工作。我有存储在Parquet文件中的数据。我只能看到LLAP相关文档或会话中提到的ORC文件。
它是否也支持Parquet格式?
回答我自己的问题。 我们联系了Azure支持。 Hive LLAP仅适用于ORC文件格式(截至05.2017)。
因此,使用Parquet或者我们必须使用Apache Impala进行快速交互式查询()替代LLAP或将存储的文件格式更改为ORC。
After finding out Hive LLAP, I really want to use it.
I started Azure HDinsight cluster with LLAP enabled. However, it doesn't seem to work any better than normal Hive. I have data stored in Parquet files. I only see ORC files mentioned in LLAP related docs or talks.
Does it also support Parquet format?
Answering my own question.
We reached out to Azure support. Hive LLAP only works with ORC file format (as of 05.2017).
So with Parquet either we have to use Apache Impala for fast interactive queries (https://impala.incubator.apache.org) as alternative to LLAP or change the stored file format to ORC.
这篇关于Hive LLAP不能与Parquet格式一起使用的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!