可以解释一下,HCatalog和HBase之间的关系是什么?
我发现了这些定义:
Apache HCatalog
HCatalog是元数据抽象层,用于在不使用基础文件名称或格式的情况下引用数据。它将用户和脚本与物理存储数据的方式和位置隔离开来。
Apache HBase
HBase(Hadoop DataBase)是一个分布式的,面向列的数据库。 HBase使用HDFS作为基础存储。它支持使用MapReduce的批处理样式计算和点查询(随机读取)。
我们在Hive中使用CREATE TABLE时,会在HCatalog中创建表。我就是不明白。为什么不在真正的HBASE数据库中?
HCatalog似乎是所有数据存储的某种metedata存储库。这是否还意味着将有关数据库和表的信息保留在HBase中?
我会很感激的解释
问候
帕维尔
最佳答案
在HIVE中创建表时,它将在HCatalog中注册。 Hive中的表可以是HBase表,但也可以是HDFS文件和目录之上的抽象
您可以找到HCatalog on HortonWorks' site的很好的解释
关于hive - HBase和HCatalog之间有什么关联?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/19997749/