我正在寻找在数据集市中填充事实表的想法。假设我有以下维度
医生
病人
日期
地理位置
病人人口学
测试
我使用了两个etl工具来填充维度表-pentaho和oracle warehouse builder。日期、患者人口学和地理位置不会从操作存储中提取数据。所有维度表都有自己的新代理项键。
我现在想用病人就诊的详细信息填充事实表,当病人在某个特定日期就诊时,他会命令进行一次检查。这是事实表中的信息。为了简单起见,我还省略了其他一些措施。
我可以从源系统创建一个包含事实表中所有必需列的连接。但是,我需要为病人、医生、测试等存储维度表中的键。实现这一目标的最佳方法是什么?
etl工具在这方面有帮助吗?
谢谢您
克里希纳
最佳答案
每个维度表都应该有一个businesskey,该businesskey唯一地标识表行描述的对象(人员、日期、位置)。在加载事实表期间,必须根据businesskey从维度表中查找primarykey。您可以选择直接查找维度表,或者在加载事实表之前为每个维度创建一个键查找表。
Pentaho Kettle为此提供了“数据库值查找”(转换步骤)。您可能还想看看kimball的数据仓库etl工具包的“交付事实表”部分。
关于database - 在数据集市中填充事实表的想法,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/2469116/