我是商务智能的新手。
我刚刚被一家公司聘用,以完成他们的Web解决方案,并实现了BI模块。经过大量阅读之后,我认为我可以大致了解BI流程的样子,您会发现我对BI流程的想法附上。
您能告诉我这是否对所有工作流程都正确吗?如果没有,请纠正我。另一个问题,我看不到数据挖掘在模式中的位置,如果需要,我应该在哪里使用它?
非常感谢,
以下是您可能要考虑的几点:
表示层是Excel还是Web服务,仅此而已?如果您想部署Web报告平台,例如SSRS,Cognos,Business Objects,Microstrategy等,该怎么办?这些平台通常无需Web服务即可直接访问数据。 您可能需要将其他数据输出到平面文件和下游数据库。数据可以基于OLAP多维数据集或原始源数据。因此,您可能希望将它们作为目标包含在主数据仓库级别和OLAP级别。 如果实现Web表示层,则它可能不仅位于OLAP多维数据集上。您可能会收到报告以报告OLAP多维数据集中所不包含的数据的请求,并且仅仅为了支持一些报告而添加它可能也不值得。如果是这种情况,那么您可能要注意,主数据仓库可能是Web报告平台的来源-而不仅仅是OLAP。 数据集市通常不包含聚合数据-它们通常包含详细信息级别的数据。 OLAP多维数据集对详细数据执行聚合,但是基础数据集市本身包含事务级事实。 您可能具有ETL流程导入的其他数据源,例如Web服务。您可能还想强调,存在多个数据库和平面文件,就像您强调可能存在多个数据集市和OLAP多维数据集一样。 对于OLAP多维数据集,您不一定需要单独的数据集市。如果要构建一个中央数据仓库,则可以创建一个中央OLAP多维数据集,并基于多维数据集安全角色来限制对数据维和数据切片的访问。 您可能要指出,在加载数据仓库之前,需要先加载登台数据库。也许不是这种情况,但是通常我建议拥有一个单独的登台数据库,以便在合并到数据仓库之前有一个加载的地方。一些ETL流程可以直接合并,因此可以直接进入数据仓库,但是在很多情况下,在将数据合并到最终目标之前将数据加载到暂存数据库中可能很有意义。这也意味着ETL /存储过程可能应该是图中的自己的实体,因为它是一种移动数据的方法,而不是目标或对象。如果您查看图表,则所有实体都是实际对象,而不是像MDX这样的过程。 您可能希望指示数据是通过ETL流程加载到数据集市中的。 ETL不仅涉及加载数据仓库,还涉及在任何阶段移动数据。即使处理多维数据集也需要ETL过程。 您的OLAP服务器不一定必须在另一台物理服务器上-它可以是数据库服务器上的服务。它仅取决于您是通过扩展还是扩展来解决性能问题,还是由于地理性能问题而打算将多维数据集发布到多个OLAP服务器。