虽然之前写过关于负载均衡的文章,但是似乎大家都对负载均衡这个标题很陌生。今天就换个角度,从分布式网站发布角度说一下
首先,网站发布一定离不开服务器,就是阿里云的云服务器ECS。最近发现,老用户也有机会购买特价服务器,参考阿里云天猫旗舰店。分布式网站架构,在开发环节需要处理号几个地方,才能更轻松的扩展:
1,数据库单独运行
这个最简单,相信只要用到了数据库的网站,大部分都是已经可以轻松实现网站和数据库分离的模式。之所以强调这点,就是因为,网站真的到了访问量大了,需要由单机发布改为分布式发布时候。首先就是要把数据库单独出来,使用单独一台ECS或者使用专门的RDS运行。
关于使用ECS自行搭建数据库,要说的无非就是,数据库文件一定要放在SSD硬盘上。因为云硬盘本质都是虚拟硬盘,读写指标iops会损失的很严重。当然业务量大了之后,我更建议选购RDS,RDS阿里云专门的数据库服务产品,mysql,sqlserver等多款分支,说实话,用惯了ECS自建可能会感觉这个产品挺贵的。但是实际上RDS已经针对硬盘读写,高可用,轻松拓展读写分离等提供了巨大的便利。因此大部分分布式网站都是选用了RDS等产品。
2,session存储
大部分网站都是有登录需求或者其他session存储需求的。其实真正服务某一个用户的服务器只有一个,然而分布式网站是在负载均衡的规则下转发到后台服务器,如果负载均衡没有开启回话保持功能,那么很有可能用户登录后,其他访问很有可能到达不同的后端服务器处理,而实现不同服务器同样能支持服务的办法就是,session得共享起来。这样就做到了让用户不需要反复登录。
session共享有多重方法,一种是什么都不用做,session存储在收到请求的那台ECS本地,这种情况就需要负载均衡开启“会话保持”功能。这么做可以实现大部分分布式发布需求,但是如果有使用session统计在线量的时候就会发现只统计到某台ECS登录的用户量。
还有一种session共享的办法是使用单独的服务存储session,例如专门拿出来一台ECS做session服务。这里也有人跟倾向于单独用一个redis服务共享存储session,也是非常好的办法。
3,用户上传的文件
很多网站存在用户上传的情况,但是分布式发布后,显然用户上传的时候传入了服务器A,等以后下载的时候使用的是服务器B,这时候如果没做共享,显然用户下载的文件会报错404,因为服务器B路径下显然没有用户传到A服务器里的文件。
解决办法很简单,就是讲所有的上传文件,传入到服务器之后,都转存到“共享文件服务器”,这个共享文件服务器,可以考虑自己搭建,但我建议的是使用阿里云提供的“对象存储OSS”服务。这样用户所有的下载,都走的时候OSS的访问地址,就不会报错404了。而且OSS是个独立的服务,下载文件使用的是OSS的流量,不占用发布网站的ECS的带宽。这就可以做到1M服务器带宽撑起峰值几十人甚至上百人的并发的原因。如果文件较多,另外建议将OSS搭配CDN使用
4,网站的日志文件
很多网站开发时候都是留有日志功能的,这些日志,就不再适合继续使用网站目录下某个路径存储了。原因跟上一条一样:文件存储在单台服务器里,要拿到全部日志文件需要每台服务器去获取一遍,显然不合适!
解决办法跟上一条很相似:使用共享文件服务器存储日志。这里需要注意避免日志文件重名,常见的年月日明明,在这里就会冲突,因为多台服务器都会产生相同文件名称的日志。但是我在这里,更建议大家把需要收集的日志文件,直接放入数据库RDS中。这样获取日志就不用每台服务器去汇总了。直接从数据库查出来就好。
5,发布网站文件一致
发布文件一致,就是为了保证更好的扩展。将来服务器压力太大,只需要直接从现有服务器环境拷贝一份即可。甚至搭配阿里云的“弹性伸缩ESS服务”。可以根据设置好的伸缩规则,自动按照某个服务器模板增加或者减少WEB服务器数量,实现弹性扩容。
综上所述,一个功能较全的分布式网站发布在阿里云,公共需要这么几个服务:ECS多台,SLB一台,RDS一台,Redis或有,ESS或有。
通过ECS+SLB+RDS+Redis+ESS的搭配,就可以轻松应对更多的访问量了。
附录:阿里云相关产品的帮助文档:
原文地址: https://www.opengps.cn/Blog/View.aspx?id=238 文章的更新编辑依此链接为准。欢迎关注源站原创文章!