一、背景

近年来,面对数字化转型带来的挑战,越来越多的企业开始将关键业务系统上云,也有更多的业务创新在云上,帮助企业实现业务增长,这些数据已经成为企业最重要的资产、资源。对于企业来说,如何确保宝贵的数据资产不丢失,不因为数据的原因影响业务的正常访问,一直是数据面对的重要挑战。

阿里云对象存储发布同城冗余存储类型,能够提供数据中心级(可用区级)的容灾能力,当断网、断电或者发生灾难事件等极端事件导致某个机房(可用区)不可用时,仍然能够确保继续提供强一致性的服务能力,可以满足关键业务系统对于“恢复时间目标(RTO)”以及“恢复点目标(RPO)”等于0的强需求。

二、技术原理解析

阿里云OSS同城冗余存储,顾名思义,将将冗余数据分布于同城的多个可用区上,其采用的是跨可用区分布式纠删码技术,传统的纠删码技术,通常是部署于同一集群,可以应对比如主机级的故障,相对于多副本技术,其能更好的实现空间利用率与数据冗余度的平衡。

OSS同城冗余存储采用6+6的纠删码,将12个数据块冗余打散分布于3个可用区上,每个可用区存在四个数据块,6+6的纠删码机制最大可以允许损坏或丢失6个数据块。因此当某个可用区(或机房)遇到极端情况导致整个可用区不可服务时,只会影响4个数据块,不会影响业务的连续性和数据的可靠性。整个过程整个故障切换过程用户无感知、业务不中断、数据不丢失。

阿里云OSS同城冗余存储技术解析-LMLPHP

同时阿里云OSS同城冗余存储采用了强一致性的模型,确保数据完全一致,无过时读取。另外为了确保整体的读写能力,同可用区之前提供了Tbps级别的带宽,让数据流快速畅通,每个可用区之间确保足够的距离,最大限度降低同城滚动式灾难风险。最终,阿里云OSS同城冗余存储能够给用户提供99.9999999999%(12个9)的数据可靠性以及99.95%的SLA数据可用性,并且在机房整体故障时,实现RPO=0,RTO=0。

三、最佳实践 -“两地三中心”架构

传统的线下数据中心,不少严苛的行业监管要求企业核心系统必须满足“两地三中心”架构,以确保核心资产万无一失。通过同城冗余存储结合现有的跨地域复制功能,可以轻松搭建“两地三中心”架构。

阿里云OSS同城冗余存储技术解析-LMLPHP

至此,阿里云OSS能够为用户不同的业务提供同机房、同城、跨地域完整的多层次的容灾服务能力。

本文作者:云攻略小攻

原文链接

本文为云栖社区原创内容,未经允许不得转载。

05-11 17:23