本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

你真的分清数据仓库和数据集市了吗?

数据库 cdadata 5372℃

你真的分清数据仓库和数据集市了吗?

数据库&数据仓库 首先,我们可以打个形象的比方。假设我是一个百货商店的老板,百货里有各种各样的商店。那么我们就可以把每个商店的营业数据称为数据库,所有商店营业数据经过结构一致化汇总到我手中的数据集合就叫数据仓库。   接下来我们给出数据仓库的定义: 数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。

(1)面向主题:指数据仓库中的数据是按照一定的主题域进行组织。

(2)集成:指对原有分散的数据库数据经过系统加工, 整理得到的消除源数据中的不一致性。

(3)相对稳定:指一旦某个数据进入数据仓库以后只需要定期的加载、刷新。

(4)反映历史变化:指通过这些信息,对企业的发展历程和未来趋势做出定量分析预测。

数据仓库&数据集市 继续拿百货商店举例。镇上每个月都会举办不同主题的商品集市,这个时候我专门整理出一些符合主题的商品到集市上贩卖,这些数据的组合就叫做数据集市。 由此可以看出,数据集市的数据是从企业范围的数据库、数据仓库中抽取出来,用以满足特定部门、团队、客户或应用程序分析和报告需求。具体来说,数据仓库仅仅是提供存储的,提供一种面向数据管理的服务,不面向最终分析用户;而数据集市是面向分析应用的,面向最终用户。

转载请注明:数据分析 » 你真的分清数据仓库和数据集市了吗?

喜欢 (2)or分享 (0)