转自:http://zhb-mccoy.iteye.com/blog/1543492

HBase中Region, store, storefile和列簇的关系-LMLPHP

The HRegionServer opens the region and creates a corresponding HRegion object. When

the HRegion is opened it sets up a Store instance for each HColumnFamily for every table

as defined by the user beforehand. Each Store instance can, in turn, have one or more

StoreFile instances, which are lightweight wrappers around the actual storage file

called HFile. A Store also has a MemStore, and the HRegionServer a shared HLog in-stance。

原博客没有翻译,我这里大体翻译一下:RegionServer打开一个region的时候,会创建一个相应的HRegion对象。当这个HRegion被打开,他会为每一个表中的

每一个列簇创建一个Stroe实例,就想用户之前创建的那样。每一个Store实例相应地有一个或者多个StoreFile实例,StoreFile是对真正存储数据的文件(HFile)的

轻量级封装。一个Store还会有一个Memstore。每一个HRegionServer中的所有东西会共享一个HLog实例。

结合前面的图看就很清晰了。

hbase table中每个列簇都对应着region中的一个store,在hdfs系统中则对应着一个目录,如果列簇中尚无数据,怎该目录为空,也就是该store下还没有storefile。

1.house_hire_analysis 表中列簇total下无数据,另一张表fangyuan下有数据:
HBase中Region, store, storefile和列簇的关系-LMLPHP

2.查看hdfs region下的内容

HBase中Region, store, storefile和列簇的关系-LMLPHP

3. hbase console 如图:

HBase中Region, store, storefile和列簇的关系-LMLPHP

4.put一条记录到house_hire_analysis中,并flush,flush将改动从memstore刷新到磁盘

HBase中Region, store, storefile和列簇的关系-LMLPHP

HBase中Region, store, storefile和列簇的关系-LMLPHP

5. hbase cosole storefile已经增加

HBase中Region, store, storefile和列簇的关系-LMLPHP

6.新flush的kv根据策略会分别存到不同的storefiles中(最后compaction 会将这些小文件合并)

HBase中Region, store, storefile和列簇的关系-LMLPHP

HBase中Region, store, storefile和列簇的关系-LMLPHP

05-27 01:16