【数据仓库】数据仓库是否仍然相关?
视频号
微信公众号
知识星球
在过去几年中,企业数据架构发生了重大变化,以适应现代企业不断变化的数据需求。 云计算、数据中枢、数据湖等先进数据存储技术的出现,让我们质疑传统数据仓库在现代数据架构中的作用。
数据仓库于 1990 年代作为决策支持系统的关系数据存储空间首次引入; 然而,多年来,它们已经发生了相当大的变化,以支持商业智能 (BI) 和数据驱动的决策制定。
它们对今天的现代企业是否仍然适用? 我们必须回到基础来寻找这个问题的答案。
数据仓库的目的
数据仓库 (DWH) 是一个集中式存储库,它整合和存储来自不同来源的历史数据,以提供组织数据的整体视图。 它包含结构化和标准化的数据,可以有效地满足业务报告的需求。
DWH 包含来自内部来源的数据,例如 CRM、ERP、财务系统和外部系统,例如合作伙伴计划。 从技术上讲,数据随后会根据 DWH 的配置进行结构化和处理,然后以统一形式存储并可用于 BI 报告。
使用数据仓库的好处
数据仓库的主要目的是为组织提供一个用于其他异构源的集中存储库,并使数据可访问以进行快速准确的 BI 报告。
它是怎么做到的?
- 充当单一事实来源:如上所述,数据仓库充当所有数据的中央平台,否则这些数据以分布式 Excel 工作表和不同的事务系统的形式分散在各处。 功能性数据仓库依靠数据建模和 ETL/ELT 流程将异构数据集成到一个地方。 通过这种集成,公司可以同时查看来自不同职能和交易领域(例如运营、销售、财务和营销)的数据,从而获得其组织的 360 度全方位视图。
- 消除数据孤岛:数据存在于孤岛中,被困在不同的数据库中,使其更容易出现差异和歧义。 如果没有数据仓库,业务分析师和决策者将难以手动或通过查询管理来自不同来源的相关数据。 单一事实来源(以数据仓库的形式)消除了数据孤岛并提高了 BI 决策制定的整体质量。
- 提供预定义结构以满足报告需求:数据仓库以结构化格式存储数据。 它使用数据建模(例如维度建模)来根据特定的报告用例定义数据点和实体之间的关系。 数据仓库架构针对更快的数据检索和查询进行了优化。
此外,数据在加载到数据仓库之前会被清理、分析和转换。 这种结构化数据已准备好进行分析,可以被 BI 软件(例如 PowerBI)无缝使用,以实现商业智能。
在数据仓库中拥有结构化数据和模式,而不是数据湖,最终可以更轻松地构建报告查询,尤其是在复杂的关系和转换中。
数据仓库是否仍然相关?
现代数据架构技术已经改变了我们在组织内与数据交互的方式。 大数据、数据湖、数据结构、人工智能和机器学习的出现让我们有更多机会有效地利用数据进行分析和决策。
这会影响数据仓库在现代架构中的相关性吗? 绝对不! 事实上,在数据管道中包含数据湖等平台有助于数据仓库和数据集市满足组织的数据需求。
最重要的是,组织仍然需要一个集中的存储库来维护异构系统中存在的历史数据。 此外,他们仍然需要访问有组织的、结构化的数据,这些数据可以轻松查询以获得及时的 BI 报告。 这表明数据仓库仍然非常重要。
到 2028 年,数据仓库市场预计将以 24.5% 的复合年增长率增长到 76.9 亿美元也就不足为奇了。大多数数据驱动的组织仍然使用数据仓库作为其数据架构的一个组成部分,并将继续这样做 可以预见的将来。
- 6 次浏览