Inmon和Kimball是数据仓库领域伟大的开拓者,他们均多年从事数据仓库的研究,Inmon还被称为“数据仓库之父”。Inmon的《数据仓库》和Kimball的《数据仓库工具箱》都是此领域的经典之作。后来人把这两人的数据仓库思想总结为“Inmon理论”和“Kimball理论”。他们的思想有共同点,也有不同点。下面按照我的想法总结一下,理解如有偏颇,还请多多指正。

1. 共同点

(1)均极力推崇数据仓库,认为从OLTP到BI分析之间建立数据仓库是很有必要的;

(2)均认为数据仓库的建立需要从企业整体角度出发,迭代开发,尽量避免按部门建立独立的数据仓库;

(3)数据进入数据仓库之前,需要经过ETL整合。

2. 不同点

Inmon理论

(1)(必须把他的经典定义放在前面)数据仓库是一个面向主题的、集成的、随时间变化的、不易改变的用来支持管理人员决策的数据集合;

(2)自上而下按照主题建立数据仓库,如按照客户、供应商、产品等建立不同的主题。开发过程中每次增加一个主题;

(3)当建立的数据集市是跨多个主题的,需要以整合好的主题数据为基础。

Kimball理论

(1)自下而上,维度建模;

(2)先按照业务主线建立最小粒度的事实表,再建立维度表,形成数据集市,通过“一致维度”能够共同看到不同数据集市的信息;

04-23 14:59