又是一年岁末,又到了做盘点的时候。根据这一年中的所做、所见、所闻、所感,笔者会同几个圈中好友(孙杰、楼炜、山金孝、肖力、北极熊),试着把国内私有云发展历程稍作整理。我们认为,国内私有云发展大体上可分为三个阶段,而今年则正式进入了第三个阶段 “3.0时代”。
首先,我们直奔主题,给出三个阶段的定义:
私有云1.0 – 基于VMware构建的私有云。
私有云2.0 – 基于OpenStack构建的私有云。
私有云3.0 - 基于公有云厂家的专有云构建的私有云。
【1】 私有云1.0时代
私有云1.0是基于VMware vSphere、SAN存储和物理网络等构建的企业私有云。下图是一典型政企单位的单IDC中的私有云架构。
图1 私有云1.0典型部署架构
这种架构具有以下主要特征:
采用主机和VMware两种架构来支持主机型应用和非主机型应用,其中VMware架构是主体;
根据业务功能和安全需要,将IDC划分为多个服务器分区,每个分区采用VMware vSphere搭建一个独立的集群,每个集群实际上是一孤岛或竖井。每当有新客户或新业务加入时,就会新增一个竖井,使得竖井数不断增加。
服务器分区之间物理隔开,各分区都接入IDC核心网络,使用防火墙实现网络隔离。
安全防护集中在IDC边界,采用大量硬件设备,在互联网和广域网接入区内进行安全防护,而内部安全控制主要通过分区边界上的防火墙来实现。
每个IDC内部通常有一个SAN存储区,通过SAN光纤网络连接多套SAN存储,为VMware集群提供存储空间。
用户要申请资源时,首先发送邮件或提交工单。收到申请后,VMware管理员在存储管理员和网络管理员的配合下创建所需虚拟机资源,并将IP地址以及账号密码交给用户。用户以使用物理机同样的方式登录和使用虚拟机。
这种私有云的优势很明显,那就是稳定、强安全隔离、强控制。但其缺点也非常明显,主要有:
实际上只是虚拟机,还不能称为真正的云,只能提供虚拟机和磁盘。
成本高。SAN存储网络设备和存储设备都架构高昂。VMware license费用也很高。
管理成本高,而且资源池无法打通,每个竖井的资源利用率不均衡,无法充分通过池化来利用资源。
只能满足稳态应用的需求,无法满足敏态应用的需求。
不能自服务交付,交付周期长。
以OpenStack的出现为契机和标志,私有云进入2.0时代。
【2】私有云2.0时代
私有云2.0 是基于OpenStack构建的企业私有云。
此时代的发端标志是OpenStack在2010年兴起,成熟标志是OpenStack私有云在2013年左右开始承载政企单位的生产系统,并在2015年左右达到发展顶峰。一政企用户OpenStack的私有云架构示例如图所示。
图2 私有云2.0典型部署架构
私有云2.0时代的主要特征:
企业IDC进入云时代,虚拟化时代成为过去。云的显著特征之一是自服务。此时代的私有云提供和公有云控制台类似的私有云控制台,结合企业审批流程,用户自助申请资源并能在比较短的时间内获得云资源。
技术上,此代私有云采用与1.0时代的私有云同样的分区隔离方式,但采用OpenStack来替代VMware。单个集群规模通常不超过500台服务器,通常采用多云管理平台来管理多个集群。除了原有SAN存储区外,部分企业采用基于Ceph的二级存储区域。
应用直接从1.0私有云环境几乎能不做任何修改地迁移到新私有云环境之中。
私有云从1.0向2.0演进的几个主要动力:
顺势而为:一方面云计算发展如火如荼,不做云不上云,那就是不顺应潮流,在上级单位和同行面前都不好意思;另一方面,国家提倡采用自主可控技术来构建私有云。
能用就用:开源的OpenStack顶着“私有云版AWS”的光环,而其某些组件(主要是计算和存储)确实具有进入生产环境的条件。
能省则省:SAN、VMware都价格高昂,IT开支巨大,降低成本的要求越来越高。天下喜VMware产品久矣,也苦其价格久矣。
IT人的自我驱动力:开源项目的蓬勃发展,各位IT人都摩拳擦掌,采用社区或商业公司的代码花个几个月就能建起一个环境还能跑起来,在学到新技术的同时还能评奖评优,一举多得,岂不快哉。
但我们也看到私有云2.0存在的不足:
私有云2.0相比1.0,除了利用OpenStack替代VMware外,在架构上并没有更多的技术革新。私有云1.0的那些不足,大部分都没有明显改善。依然只以提供虚拟机和磁盘为主。
用户们的用云观念一直在提升,2C类应用越来越多,对除了计算外的其它云服务的要求也越来越多,而这些需求OpenStack私有云无法满足或不能很好地满足。
OpenStack社区的发展在2015年左右后开始走下坡路,发展速度下降,与VMware和各公有云的差距开始拉大,用户们逐渐对其失去继续投入的信心。
于是,过去的几年中,我们就看到了广大政企用户的IDC里面,采用各种版本的OpenStack集群越来越多。这些集群几乎无法升级,无法下线,很难迁移,维护成本越来越高,只能提供有限的服务,用户们对其抱怨也越来越多,IT老大们对其信心越来越少。
痛点也意味着商机。
【3】私有云3.0时代
私有云3.0是基于公有云厂家的专有云构建的大型私有云。
这个时代开始的标志是各大公有云厂商纷纷推出基于公有云架构专有云产品。
2016年4月,阿里云发布专有云(ApsaraStack),支持企业客户在自己的数据中心部署阿里云飞天操作系统。
2018年1月,腾讯云发布专有云产品矩阵TCE(Tencent Cloud Enterprise),其基于腾讯云成熟产品体系的企业级专有云平台,为企业提供自主可控、弹性伸缩的全栈服务能力。
2018年11月,AWS 发布 AWS Outposts,其将 AWS 引入本地数据中心,使用户能“在本地运行 AWS 基础架构,以获得真正一致的混合云体验”。一年后AWS Outposts正式推出。
2020年5月,华为云宣布华为云Stack系列新品正式上市。华为云Stack Online解决方案是华为云的延伸,以一体化全栈方式交付完整的云服务能力。
以腾讯专有云TCE为例,其在底座之上插件式地提供IAAS、PAAS、安全、大数据、AI等多种服务。这些服务基本脱胎于腾讯公有云,经过了大量公有云用户几年时间的使用。
图3 腾讯云TCE产品架构
这个时代发展的标志是公有云厂家利用其专有云获得越来越多、越来越大的政企私有云订单。
据公开消息统计,2020上半年云计算市场中标项目58个,其中仅上亿订单就高达11个, 其中,华为云总订单22个, 阿里云总订单21个, 腾讯云总订单15个。腾讯云斩获最高标的总订单额达10.66亿。华为云斩获智慧城市类最大订单,总标的达8.38亿元;阿里云与中华保险签订战略合作,金额7亿元。
私有云3.0架构
新一代私有云,采用由公有云厂家提供的基于其公有云架构的专有云产品,以公有云部署架构在客户数据中心内进行部署。一个典型的部署示例如下图所示。
图4 私有云3.0典型部署架构
客户在两地三个数据中心内各部署一套某专有云平台来构建起新一代私有云。该私有云的部署模式同公有云,包含两个region和三个可用区。在主Region内,VPC可以跨两个可用区来支持应用的跨数据中心高可用。基于三个数据中心之间的骨干网络,支撑两个region中的VPC得以对等连接起来。在此云平台之上,用户可以构建跨两地三中心的高可用应用部署架构。
为什么私有云3.0会出现呢?
在笔者看来,私有云3.0出现的主要原因有:
私有云2.0的缺陷无法得到根本性解决,用户对云的新需求得不到满足,特别是对敏捷、高效和快速响应等能力有更高要求的2C类应用对于云平台的弹性扩展、高性能、跨IDC高可用、全服务支持、云原生等的需求。
公有云模式已得到广大用户的认可,但大型政企用户因为合规和安全等考量而需要私有云,因此利用公有云架构的专有云构建私有云就一拍即合。
公有云厂商的公有云平台经过多年发展后不断趋向成熟,基于其构建的专有云平台也在接近成熟。公有云厂商在互联网式的公有云上不断推出新服务,等其稳定成熟后即打包进专有云,来服务对稳定和成熟有更高要求的政企用户。
而为什么基于OpenStack的私有云2.0无法解决其缺陷呢?笔者认为的主要原因有:
OpenStack的核心功能在过去几年内没有得到显著提升,依然局限在计算和存储。对大规模、分布式网络、容器、PAAS、安全、热升级、跨IDC高可用等的支持依然缺失或稚嫩。
OpenStack依然局限于传统私有云模式,采用与VMware类似的强隔离方式,无法做到公有云上的强逻辑隔离(基于VPC和CAM),这无法避免其烟囱式存在。
OpenStack社区日渐式微,影响力在下降。
市场上没有出现基于OpenStack的与现有专有云产品相媲美的云平台产品和大厂家,从而无法获得大型政企用户足够的认可。(华为云、百度云、京东云等虽然也是基于OpenStack构建的,但已经被改得面目全非了)
私有云3.0带来的机遇
公有云厂家的势力范围将延伸到大型政企客户的数据中心内,为与其公有云构建真正意义的同质混合云提供了强大条件。公有云厂商将强者俞强,公有云和私有云通吃,而且逐步构建起连接起其公有云和大型政企客户的混合云护城河。国内公有云上都是以中小用户为主,大型政企用户一直是公有云厂商们梦寐以求的。
图5 同质的私有云和公有云构成混合云
用户也得以从私有云(IAAS)的构建和运维中解脱出来,将资源放到PAAS和SAAS的研发和使用上来,真正让云成为驱动其数字化转型的基座。上云也将从1.0发展到2.0,云原生改造将取代镜像克隆成为应用上云的主要形式。
用户利用新一代全栈私有云平台能产生多大业务价值将成为关键。这种私有云动辄投资以亿元计。如何利用其驱动企业数字化转型、研发和业务升级等,将成为摆在企业经营者面前的课题。而业界的先行者中,可能会出现一批类似德勤和麦肯锡这种的国产“云原生”咨询公司。
云MSP服务商的业务范围将得以延伸,从原来的只有公有云延伸到用户的私有云。他们象帮助公有云用户那样,帮助私有云用户上云和用云。
多云管理平台厂商的产品价值将得以增强和简化。云平台越同质,其产品化工作量和难度就越小。
私有云3.0 带来的一些其它问题和影响
几大公有云厂商的专有云产品依然需要打磨。如何将非产品化的公有云,转化为产品化的专有云,这非常考验厂商的能力和定力。
基于专有云的新一代私有云的交付模式需要突破。如果在接到每个单子后,公有云厂商都要投入几十甚至几百人在几个月甚至一两年时间内才能完成交付,那这种交付模式将难以复制。笔者看来,亟需在交付模式上有所突破创新,才能让这种业务模式更有生命力。
基于专有云的新一代私有云的运维模式也需要突破。专有云是闭源的,类似VMware,但又没有VMware的良好可维护性,那谁来运维、怎么才能做好运维就成了一个问题。类似AWS Outposts的远程运维模式,似乎在国内水土不服,无法得到政企用户的认可。
市场期待突破性混合云产品出现,而不只是拉一根专线把用户IDC和公有云IDC连接起来。用户需要的是跨IDC的应用层面的融合。
云技术从业人员可能面临又一次的技术发展方向选择。IAAS技术可能将集中到公有云厂商,具有公有云架构、研发、运维和解决方案等经验的人才将成为云就业市场上的宠儿。
【4】小结
将三个时代的私有云放在一张表格中简单进行对比:
图6 三种私有云简单对比
私有云从1.0一步一步发展到3.0这过程中,用户是主角。用户对云的使用越来越多,对云的认识也越来越到深,对云的要求越来越高,对云也越来越认可。用户既要公有云的体验,也要私有云的安全和可控,这在一步一步地推动私有云朝着“部署在用户数据中心内的公有云”方向发展。
私有云从1.0一步一步发展到3.0这过程中,用户对云供应商的要求越来越高。私有云用户,特别是大型政企用户寻找的私有云供应商,不再是某个产品的供应商,而是企业数字化转型合作伙伴,不仅在云平台等产品和技术上要具有行业内头部实力,而且要求在云运维和运营、上云实践、云安全、云推动数字化转型等上具有丰富的实力和实践经验。这一切都说明,私有云不再是小厂商的游戏,头部厂商优势明显。公有云在吞噬一切。中小型云计算公司,将要么加速被淘汰,要么加速进入公有云厂商的生态圈,成为其一合作伙伴。
私有云从1.0一步一步发展到3.0这过程中,用户对云的使用也一步一步深入。如何用云,已成为私有云用户单位经营者们最关心的议题之一。纯粹人力投入之类的事情,比如云平台的建设和运维,会逐步外包给第三方团队。而企业的核心IT价值,则是利用云来促进企业组织、业务等进行数字化转型,因此,企业IT资源会向这些方向进一步倾斜。
3.0时代的私有云,跨越IAAS,进入全栈云模式。云的复杂性的提升的同时,技术在向公有云靠拢,这会给Cloud MSP 带来机会,使他们成为公有云生态中越来越重要的一环。
对于企业来说,云就是这个数字化时代的基座。我们可以期待,云投入后将为企业产品和业务带来巨大的竞争力,“标准化、数据化、智能化”后的一切在线,将带来企业运营管理的高效。云和行业知识结合后进入市场中的新品,是新时代的物种,代表着最佳业务流程、最佳应用体验的产品化,会形成企业的核心竞争力。
云的未来,对于企业来说,是企业数字化的基座,是企业竞争力提升的发动机;对于行业来说,是行业云的不断成长,通过行业的头部厂商赋能整个行业,是行业竞争力提升的核电站;对于国家来说,通过公有云实现国家层面的资源融合、生态聚合和产业升级,将带来国家竞争力的提升。
感谢您的阅读,欢迎关注我的微信公众号,也提前祝您新年快乐!感谢您在2020年里的一路相伴!