【每日阅读】2020年11月27日-系统获得高可用的思路

有疑问就留言给我吧😄

20201128001205

大多数线上执行的系统应该是要保持在3个9和4个9之间的高可用性。毕竟5个9真的是太难了,我们接收到报警到登录到线上机器的时间应该都超过了5分钟。

高可用主要从两方面考虑,一方面是软件设计需要思考的。另一方面是运维人员需要考虑的。

软件设计阶段

这一阶段主要思路就是:冗余、维护主流程。例如可以在多个机房搭建服务,在发生故障时只要其中一个机房是可用的就没问题。维护主流程的意思是要给系统一个降级的方式,在某些时候只要保证主流程可以进行就行,那些旁枝末节的功能可以直接关闭,虽然会影响用户体验,但是影响不大。

运维阶段

运维阶段主要思考两部分:一部分是上线阶段,毕竟大多数问题都是在上线新功能是时候引入的。另一部分是日常故障演练,在没事的时候给自己找一些事,当真的遇到事时处理起来会更加得心应手。

上线阶段目前业界主流解决方案是进行灰度上线,不一次性上完全部机器,而是先调一部分机器或者一部分流量走新代码去处理,发生问题也只影响其中一部分用户而已,不会发生太大的问题。

原创文章,作者:geekgao,如若转载,请注明出处:https://www.geekgao.cn/archives/2714

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

GitHub
分享本页
返回顶部