【灾难恢复】AWS上数据库的灾难恢复策略 --测试以获得信心

视频号

微信公众号

知识星球

Chinese, Simplified

数据库的最佳灾难恢复解决方案是经过频繁测试并通过以下检查的解决方案:

  • 适当的数据恢复,满足每个数据库的RPO期望
  • 在预期的RTO时间框架内完全恢复正常运行的数据库,这允许应用程序连接到数据库并恢复全部功能

灾难恢复测试应该是您的业务战略的一部分,以便备份在最需要时工作。灾难恢复测试还应解决以下情况:

  • 数据库的规模大幅增长,您当前的灾难恢复战略不再符合业务的服务级别协议(SLA)。
  • 备份文件已损坏,这可能会在恢复过程中导致问题。

测试灾难恢复战略时应考虑什么

  • 在RPO和RTO方面有明确的业务连续性目标,并确保测试结果符合您的目标。
  • 创建详细的灾难恢复测试计划,将测试的财务和人力资源需求考虑在内。
  • 分配资源记录潜在问题和经验教训。
  • 根据经验更新您的灾难恢复战略,找到支持最佳流程和自动化的解决方案,为您的组织工作。

DR解决方案的测试频率

  • 除非法规明确规定,否则DR测试周期没有设定建议。例如,支付卡行业数据安全标准(PCI DSS)合规性审计要求组织每年至少测试一次灾难恢复计划。(请参阅PCI DSS要求网站上的PCI DSS灾难恢复要求。)
  • 当应用程序或基础架构发生变化时,应用程序团队还可以对其单个灾难恢复解决方案进行连续测试。

漂移检测

DR解决方案还应管理漂移检测。这将确保主区域和DR区域处于正确的同步级别,并确保测试过程中的顺利进行。AWS Config提供基础架构中配置的配置管理和历史跟踪,可以帮助您有效地管理漂移。

可观察性

提高可观测性会对测试准备产生积极影响。所有灾难恢复解决方案都将数据从主区域移动到辅助(DR)区域。您可以为复制延迟和备份设置警报,或者设置一个流程来执行日常检查,以确保您的数据成功复制到DR区域。

本文地址
https://architect.pub
SEO Title
Disaster recovery strategy for databases on AWS -- Testing to achieve confidence