第7期 部署两地三中心解决方案SDRS+CBR

  • 1.实施步骤(部署跨可用区容灾)
    • 配置跨可用区容灾
      • 操作场景
      • 约束与限制
      • 创建保护组
    • 什么是SDRS
    • 什么是CBR
    • 什么是两地三中心容灾方案(SDRS+CBR)
    • 应用场景
    • 方案优势
    • 三种容灾方案对比
  • 2.两地三中心方案原理
    • 生产站点正常工作
    • 生产站点故障
    • 生产站点和跨可用区容灾站点同时故障
  • 3.资源和成本规划
    • 部署跨可用区容灾
    • 部署跨区域容灾

第7期 部署两地三中心解决方案SDRS+CBR-LMLPHP

1.实施步骤(部署跨可用区容灾)

配置跨可用区容灾

操作场景

由于不可抗力因素(比如火灾)或者设备故障(软、硬件破坏),导致生产站点故障,且在短时间内无法恢复时,SDRS可提供跨可用区RPO=0的弹性云服务器级容灾保护。

采用存储层同步复制技术提供跨可用区的容灾保护,满足数据崩溃一致性,当生产站点故障时,通过简单的配置,即可在跨可用区容灾站点迅速恢复业务。

采用SDRS创建跨可用区容灾保护的流程分为三大步:

  • 创建保护组
  • 创建保护实例
  • 开启保护

约束与限制

  • 如果生产站点服务器已经被添加到云服务器组中,则不支持指定专属主机创建容灾站点服务器。
  • 保护实例创建完成后,系统默认容灾站点服务器名称与生产站点服务器名称相同,但ID不同。
  • 如果需要修改服务器名称,请在保护实例详情页面单击服务器名称,进入服务器详情页面进行修改。
  • 创建保护实例完成并对生产站点的服务器做容灾保护后,生产站点服务器中的“主机名”、“名称”、“委托”、“云服务器组”、“自动恢复”、“安全组”和“标签”配置项修改不会再自动同步到容灾站点的云服务器上。您可以登录控制台,手动将这些配置项的修改添加到容灾站点的云服务器上。
  • 由弹性伸缩组伸缩时所创建的云服务器,在对该云服务器做容灾保护后,当弹性伸缩组缩容时,不支持对该云服务器执行删除操作。
  • 创建保护实例时,如果生产站点服务器为Windows云服务器且设置为密钥方式登录,请确保生产站点服务器使用的密钥对存在,否则可能导致云平台无法创建容灾站点服务器,从而导致创建保护实例失败。
说明:如果生产站点服务器对应的密钥对已经被删除,青重新创建相同名称的密钥对
  • 创建保护实例时,如果生产站点服务器为Linux云服务器且设置为密钥方式登录,创建容灾站点服务器后,容灾站点服务器详情不显示密钥对信息,但可以使用生产站点服务器的密钥对登录容灾站点服务器。
  • 创建保护实例时,选择的生产站点服务器如果加入了企业项目,保护实例创建成功后,容灾站点服务器不会自动加入企业项目,如有需要请手动将容灾站点服务器加入到企业项目。

创建保护组

什么是SDRS

存储容灾服务(Storage Disaster Recovery Service,SDRS)是一种为弹性云服务器、云硬盘和专属分布式存储等服务提供容灾的服务。通过存储复制、数据冗余和缓存加速等多项技术,保障用户数据的可靠性以及业务的连续性。

什么是CBR

云备份(Cloud Backup and Recovery,CBR)是一种为云内的弹性云服务器、云耀云服务器、裸金属服务器、云硬盘、SFS Turbo文件系统、云下VMware虚拟化环境和云下主机上的单个或多个文件以及数据库,提供简单易用备份的服务。针对病毒入侵、人为误删除、软硬件故障等场景,可将数据恢复到任意备份点,保障用户数据的安全性和正确性,确保业务安全。

什么是两地三中心容灾方案(SDRS+CBR)

两地三中心容灾方案(SDRS+CBR)通过SDRS将生产站点的数据同步复制到同区域下的不同可用区,形成跨可用区容灾站点;通过CBR将生产站点的数据周期性备份到不同区域,形成跨区域容灾站点。生产站点、跨可用区容灾站点、跨区域容灾站点共同组成两地三中心架构,满足两地三中心容灾方案的诉求。

这里的跨可用区容灾站点,对应上述两地三中心中的同城灾备中心,跨区域容灾站点对应两地三中心中的异地灾备中心。

下文中两地三中心容灾方案(SDRS+CBR)简称为SDRS+CBR容灾方案。
第7期 部署两地三中心解决方案SDRS+CBR-LMLPHP

两地三中心容灾方案(SDRS+CBR)中,“两地”是指容灾方案部署在两个区域,“三中心”分别是一个生产站点、一个同区域跨可用区容灾站点(下文简称为跨可用区容灾站点)和一个跨区域容灾站点。

两地三中心容灾方案(SDRS+CBR)分别通过SDRS将生产站点的数据同步地复制到跨可用区容灾站点,通过CBR将生产站点的数据周期性地备份到跨区域容灾站点,满足两地三中心的诉求。

应用场景

SDRS+CBR容灾方案适用于使用弹性云服务器和云硬盘运行业务的场景。

方案优势

相比跨可用区容灾和跨区域容灾的“双站点”容灾方案,SDRS+CBR容灾方案结合两者的优势,可以同时应对可用区级别故障和区域级别灾难。

  • 对于可用区级别故障,容灾切换时保证磁盘数据一致性。
  • 对于区域级别灾难,该方案可将业务恢复至最近一次备份时间点,尽可能保全业务数据不丢失。

三种容灾方案对比

2.两地三中心方案原理

本章节分别通过生产站点正常工作、生产站点故障以及生产站点和跨可用区容灾站点同时故障三个场景,介绍在不同的故障情况下,本方案如何接管用户的业务

生产站点正常工作

当生产站点正常工作时,状态如图1所示。

  • 通过SDRS,在区域A内将可用区1的生产站点服务器的数据、配置信息同步复制到可用区2的跨可用区容灾站点,为跨可用区容灾做准备。日常可定期进行容灾演练,模拟真实故障恢复场景,制定应急恢复预案。
  • 通过CBR,对位于区域A的生产站点服务器进行周期性整机备份,然后周期性将整机备份复制到区域B的跨区域容灾站点,为跨区域容灾做准备。
    图1 生产站点正常工作
    第7期 部署两地三中心解决方案SDRS+CBR-LMLPHP

生产站点故障

在出现设备故障等小范围的故障,造成生产站点不可用时,应用可在不丢失数据的情况下切换到跨可用区容灾站点运行,如图2所示。

该阶段的容灾RPO(Recovery Point Objective)等于0,RTO(Recovery Time Objective)在30分钟内。
说明:

RPO:最多可能丢失的数据的时长。

RTO:从灾难发生到整个系统恢复正常所需要的最大时长。
图2 生产站点故障
第7期 部署两地三中心解决方案SDRS+CBR-LMLPHP

生产站点和跨可用区容灾站点同时故障

在出现自然灾害地震等大范围灾难,造成生产站点和跨可用区容灾站点同时不可用时,应用可以切换到跨区域容灾站点。通过周期性复制到区域B的整机备份创建整机镜像,然后使用整机镜像创建云服务器,在跨区域容灾站点恢复应用,保证业务连续运行,如图3所示。

该阶段的容灾RPO取值为0 ~ 周期性备份间隔,当前备份间隔最小为1小时,RTO在30分钟内。
说明:

跨区域容灾阶段,RPO = 发生灾难时间点 - 最新的备份文件时间点。
图3 生产站点和跨可用区容灾站点同时故障
第7期 部署两地三中心解决方案SDRS+CBR-LMLPHP

3.资源和成本规划

本章节介绍最佳实践中资源规划情况,实际业务中还需要考虑资源规格的不同每月费用的变化或是每年费用才能实现资源和成本的最佳规划。

部署跨可用区容灾

部署跨可用区容灾资源规划说明

部署跨区域容灾

*部署跨区域容灾资源规划说明 *

04-14 15:54