我们有一个接收申请人的应用程序,然后从不同的供应商那里检索该申请人的各种“信用类型评分”。

我们有一个超过1000列的事实表。
原因是我们的数据分析人员要求使用“平整”的非规范化表,该表包含所有供应商提供给我们的所有评分。
例如vendor_1_score_a,vendor_1_score_b等。

该事实表也是细粒度的,因为每一行都包含一个申请人交易。

我的问题是,由于我们遇到“列太多”类型错误,是否有更好的方法为我们的数据分析师团队设计此事实表。

谢谢

最佳答案

数据仓库的事实表通常如您所描述的那样扁平化。检索速度比参照完整性重要得多。

您可以使用专门为数据仓库设计的数据库。

如果必须使用MySQL,则可以创建Vendor表。每个供应商都有一行指向应用程序行。

不用担心标准化Vendor表。由于这是一个数据仓库,您可以在其中添加行并选择行,因此可以接受有关供应商的重复数据。

10-06 14:00