1、DSO的分类,标准DSO(生成主数据标识、对于相同关键字段的值进行合并、可直接出具报表)、写优化的DSO(不生成主数据标识、不合并相同关键字段的值、速度快可用于存储大容量数据)、直接写入的DSO,这三种DSO各有用处
2、标准DSO需注意的问题是,如果是激活业务内容的DSO,然后复制出来作为自己的DSO使用的话,一般不需考虑关键字段的问题,系统的设置一般会保证DSO数据与PSA数据完全一致,但如果是自己通过直接输入信息对象创建的DSO,则需考虑值的合并,因为在标准DSO对于相同关键字段的值系统会自动合并,这个时候需注意转换中的规则明细是覆盖还是合计,如果有合并的字段,即DSO更新的数据少于PSA的数据,建议把转换中值字段的规则明细全部修改为合计,以保证值的正确,总之,在使用标准DSO时需考虑值的合并问题,并考虑转换的规则明细,但使用写优化的DSO则不存在该问题
3、建议如果采用三层数据模型架构的话,可考虑第一层使用写优化的DSO,保证该层DSO数据与PSA完全一致,第二层DSO使用标准DSO,第三层使用CUBE
4、后发现在完全更新的数据源情况下,写优化DSO在新增数据时,会重复计算以前已抽取数据,建议在建立DSO时需仔细考虑DSO类型、数据更新方式、DSO关键字段和数据字段设置、以及转换中的明细规则中的集合设置为覆盖还是合计
标准:对应后台3个表,NEW TABLE/LOG TABLE/ACTIVE TABLE,即保存了DELTA增量的CHANGE LOG数据。一般通过DTP来更新数据。这种DSO也是我们用的最多的类型。
直接更新:一般用来做一定的应用,如APD。是通过BW中的业务平台,将数据通过API的方式,直接写入的。其后台只对应ACTIVE TABLE。
写入优化的:这种DSO类型,用来处理大量的数据,但后台也只对应ACTIVE TABLE。通过DTP来更新数据。
激活后生成主数据标识:在激活数据后,生成主数据的SID,可以提高报表查询的速度。如果DSO不直接用于报表的需求,或用的比较少,此选项一般不选择。
唯一数据记录:当激活“激活后生成主数据标识”后,此选项才可以选择。标识上载的数据都是主键唯一。这样做,可以提高激活的速度,上载的数据只做 INSERT操作,不考虑排序和前镜像的情况。如果我们要对数据进行DELTA抽取,并且数据可能会涉及到修改,此选项选择的话会有错误发生。一般建议,如果标准DSO选择了“唯一数据记录”,使用写优化类型代替。
自动将状态设置为’好’:激活数据后,如果没有错误发生,自动将状态设置为OK,即:绿灯,一般我们选择此选项。
自动激活数据/自动更新数据:标识自动激活数据并将数据更新到目标(如CUBE等)。为了能在处理链中处理异常情况,这里我们一般不选择。