【数据仓库架构】数据仓库-星型模式与平面表

Chinese, Simplified

问题

我试图设计一个数据仓库,用于存储从财务系统、项目调度系统到无数科学系统等常见的数据。 许多不同的数据集市。

我一直在阅读数据仓库和流行的方法,如星型模式和Kimball方法等,但有一个问题我找不到答案:

为什么将DW数据集市设计为星型模式而不是单个平面表更好?

当然,事实和属性/维度之间没有连接比所有维度表都有许多小连接更快、更简单吗?磁盘空间不是问题,如果需要的话,我们将向数据库抛出更多的磁盘。现在的星型模式是稍微过时了,还是仍然是数据架构师的教条?

答案1:

你的问题很好:维度建模的Kimball mantra是提高性能和可用性。

但我不认为这是过时的,或教条-这是一个合理的,实用的方法,为许多情况和平台。

关系数据库存储数据的方式意味着在表的数量和类型、典型查询到数据的路由、数据之间关系的易维护性和描述、连接的数量、连接的构造方式、列的可索引性等方面需要平衡。

3NF(或更进一步)是频谱的一端,适用于OLTP系统,一个表是频谱的另一端。维度模型居中,适合于报告,至少在使用某些技术时是这样。

性能并不完全与“连接数”有关,尽管星型模式在报告工作负载方面比完全标准化的数据库性能更好,部分原因是连接数减少。维度通常非常宽。如果您在每个事实的每一行中都包含所有这些维度字段,那么实际上您有非常大的行,并且找到进入这些行的方法对于典型的查询将执行非常糟糕的操作。

事实是很多的,所以如果你能使这些表变得紧凑,并且“更冗长”的维度是可过滤的,那么你就达到了一个性能上的最佳点,除非索引很重,否则一个表是不匹配的。

是的,对于一个事实来说,一个表在表的数量上更简单,但它真的更容易导航吗?维度和事实是很容易理解的概念,如果您想跨事实交叉查询呢?您有许多不同的数据集市,但首先拥有数据仓库的好处之一是,这些集市并不明显—它们是相关的,可以跨数据仓库进行报告。一致的维度使之成为可能。

答案2

如果将事实和维度合并到一个表中,则可能会丢失从未使用过的维度属性的可见性,或者通过为未使用的维度属性包含虚拟事件而放弃度量。

例如,餐厅菜单是一个维度,购买的食物是一个事实。如果你把这些东西放在一张桌子上,你会如何确定哪些食物从未被点过?因此,在您第一次点餐之前,您如何确定菜单上有哪些食物?

维度代表可能性,事实代表可能性的实现。

 

原文:https://stackoverflow.com/questions/44517192/data-warehousing-star-schema-vs-flat-table

本文:

讨论:请加入知识星球或者微信圈子【首席架构师圈】

SEO Title
Data Warehousing - Star Schema vs Flat Table

【灾难恢复】AWS上数据库的灾难恢复策略 -- 目标业务成果

视频号

微信公众号

知识星球

Chinese, Simplified

本节讨论与定义和构建AWS数据库灾难恢复(DR)计划相关的预期结果。

遏制财务损失

如果您为存储应用程序数据的数据库提供了一个设计良好的灾难恢复解决方案,您可以更快地从灾难事件中恢复,并且数据丢失最少或没有。这将最大限度地减少因应用程序长时间不可用或在最坏的情况下永久丢失数据而可能造成的财务损失。

减少对关键业务流程的影响

当您确定第0层服务和流程,并规划灾难恢复战略以快速恢复这些服务和流程时,您将能够减少对这些服务和过程的重大影响,并处理相关流程的恢复。

减少真实事件期间的手动协调(自动化)

如果您选择自动化灾难恢复解决方案,则可以减少在发生事件时运行灾难恢复解决解决方案所需的手动协调。即使在测试业务连续性计划(BCP)时,自动化也是有益的,BCP规定了在计划外中断期间如何维持标准业务运营。

留住您的客户

在竞争激烈的市场中,您的灾难恢复战略会影响您赢得客户忠诚度和留住客户的方式。如果您的组织有能力从灾难中快速恢复,您可以与客户建立信任。

增强安全性

精心规划的跨地区灾难恢复策略可以帮助将勒索软件攻击的影响限制在一个AWS地区,并使您能够在另一个地区自由使用数据,而不会丢失数据。

提高员工生产力

如果您的员工非常了解灾难恢复流程,并对其感到满意,灾难恢复事件不会引起恐慌。您可以遵循定义明确的运行手册来实施灾难恢复解决方案,您的员工可以充分利用他们的时间让您的业务恢复正常。

本文地址
https://architect.pub/disaster-recovery-strategy-databases-aws-targeted-business-outcomes
SEO Title
Disaster recovery strategy for databases on AWS -- Targeted business outcomes