我已经阅读了很多关于星型模式的信息,关于事实/决策表,用于快速报告数据的选择语句,但是对我来说,将数据输入星型模式的问题似乎不那么重要了。一个“理论上”如何将数据输入星型数据库?同时维护事实表。是带有20个参数的巨型存储proc内的一系列INSERT INTO语句的唯一选择(以及如何填充事实表)。
非常感谢。

最佳答案

首先从尺寸开始-一张一张。使用ECCD(提取,清洁,符合要求,交付)方法。

确保每个维度都有一个BusinessKey来唯一标识维度行描述的“对象”,例如一个人的电子邮件。

加载尺寸后,准备关键查找管道。通常,对于每个维表,您都可以准备一个关键查找表(BusinessKey,PrimaryKey)。一些设计人员选择直接查找维表,但是键查找通常可以轻松地缓存到内存中,从而可以更快地加载事实。

也将ECCD用于事实数据。 ECC部分发生在登台区域中,您可以根据需要为ECC的每个步骤选择(帮助)表或平面文件。

交付事实表时,将事实行中的每个BusinessKey替换为从键查找表中获得的匹配的PrimaryKey。将所有BusinessKey替换为其匹配的PrimaryKey后,将行插入事实表。

不要浪费您的时间,请使用ETL工具。您可以免费下载Pentaho Kettle(社区版)-它具有实现此目的所需的一切。

关于database - 插入星型模式,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/2496610/

10-10 07:23