DSS
数据仓库(Data Warehouse)是一种针对特定应用场合而(Integrated)构建的特殊数据库,是存储和管理大量被汇集、整理和存取后的数据,以支持数据分析和支持决策的仓库,是以应用场景驱动的,不同应用场景的数据仓库具有不同的构建的,有的是构建基于聚合数据的汇总型数据仓库,而另一些数据仓库则使用基于原子数据的详细型数据仓库。但是,在此背景下,构建数据仓库仍然是一个令人沮丧的过程,因此,从Data Vault(数据堡垒)和Kimball数据仓库架构建开始,人们开始探索更高效的方法来构建数据仓库,提高构建效率,改善建立管理及质量。
这就是Scaled Data Warehouse(SDW)出现的原因——支持高可用的构建,管理及质量的数据仓库,通过把决策的支撑者和决策的使用者分离,即Decoupling,有效的为工作流程数据仓库架构提供基础支撑。
所以,SDW是一种面向下游消费者、以Decoupling和API集成主导的数据仓库,尤其适合大型企业——因为他们的数据存储量,业务场景的多样性。SDW的核心概念主要体现在以下两个方面:
1、数据仓库可以以模块化的组织方式来分解,每个模块可以有自己的数据存储,计算以及分发机制;
2、采用 “API First” 的编程模式,SDW支持面向服务,每个服务专注提供一项特定的功能,并提供一组以Restful形式公开的API来使下游用户可以方便地调用服务进行查询分析。
这种形式的数据仓库多样性和灵活性非常大,不再是简单的决策支撑,而是可以支持产品的改变及快速落地,可以在两个方面大大简化数据仓库的构建和管理,以响应产品发展的时间变化,从而提高业务流程和分析结果效率。
总之,Scalable Data Warehouse(SDW)是一个高可用的构建、管理及质量的数据仓库,包括以Decoupling和API集成为基础,支持面向下游消费者的数据仓库,可以大大改善企业的工作流程、数据仓库架构搭建过程,从而提高业务流程和分析结果的效率。