据我所知,在CREATE TABLE-statement末尾的Impala中,您可以设置复制因子:
CREATE [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name
...
[CACHED IN 'pool_name' [WITH REPLICATION = integer] | UNCACHED]
无论如何,我对
pool_name
所指的感到有些困惑。这是HDFS中存储数据的路径吗? 最佳答案
不完全是,它实际上是指使用hdfs cacheadmin -addPool...
命令定义的HDFS池,请参阅hdfs command guide。反过来,池确实包含一堆引用要缓存的hdfs路径的缓存指令。从Apache文档:
可以在Impala Guide中找到有关如何在Impala中使用此HDFS功能的详细信息。
关于sql - 'pool_name'在CREATE TABLE语句中是什么意思?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/56595320/