数据中台从某个意义来说属于数仓的一种,都是要把数据抽进来建立一个数据仓库。 但是两者的数据来源建立数仓的目标以及数据应用的方向都存在很大差异

首先,从数据来源来说数据中台的数据来源期望是全域数据包括业务数据库,日志数据,埋点数据,爬虫数据,外部数据等
数据的来源可以是结构化数据或者非结构化的数据。而传统数仓的数据来源主要是业务数据库,数据格式也是以结构化数据为主。

其次,建立数据中台的目标为了融合整个企业的全部数据,打通数据之间的隔阂,消除数据标准和口径不一致的问题。数据中台通常会对来自多方面的的基础数据进行清洗,按照主题域概念建立多个以事物为主的主题域比如用户主题域,商品主题域,渠道主题域,门店主题域等等。数据中台遵循三个one的概念: One Data, One ID, One Service,就是说数据中台不仅仅是汇聚企业各种数据,而且让这些数据遵循相同的标准和口径,对事物的标识能统一或者相互关联,并且提供统一的数据服务接口。就像做菜一样,按照标准化的菜名,先把所有可能用到的材料都准备好。而传统的数仓主要用来做BI的报表,目的性很单一,只抽取和清洗该相关分析报表用到基础数据,新增一张报表,就要从底层到上层再做一次。

然后,在数据应用方面,建立在数据中台上的数据应用不仅仅只是面向于BI报表,更多面向营销推荐,用户画像,AI决策分析,风险评估等。而且这些应用的特点是比较轻,容易快速开发出来,因为重要的数据分析工作在数据中台已经完成并且沉淀,之前工作成果都能被多个应用共享。
而传统的数据仓库主要是面向报表,数据应用的建设就是传统烟囱式建设,每次都从头再来的开发方式。

最后,数据中台是建立在分布式计算平台和存储平台,理论上可以无限扩充平台的计算和存储能力。而多数的传统数仓工具都是建立的单机的基础上,一旦数据量变大,会受单机容量的限制。

数据中台与数据仓库的区别?-LMLPHP

数据中台不单单指系统或者工具,而是一个职能部门,通过一系列平台、工具、流程、规范来为整个组织提供数据资产管理和服务的职能部门。数据中台负责全域数据采集数据资产加工和管理、并向前台业务部门和决策部门提供数据服务的,所以数据中台的核心应该是数据资产管理和数据赋能。通俗的讲就是数据弹药库。

数据中台与数据仓库的区别?-LMLPHP

以上内容转自知乎:https://www.zhihu.com/question/282421879

更多面向营销推荐,用户画像,AI决策分析,风险评估等
[Gèng duō miànxiàng yíngxiāo tuījiàn, yònghù huàxiàng,AI juécè fēnxī, fēngxiǎn pínggū děng]
More for marketing recommendations, user portraits, AI decision analysis, risk assessment, etc.
 
03-25 02:04