运维时如何合理选择系统升级的时间

[openGPS.cn] 季雨林 2017/3/4 14:03:37

    系统升级,是随着发展,任何系统都必然经历的一个环节,今天小编完全是突发兴致,想说说自己的一个系统升级的时间点选择原则


    对于大部分系统来讲,升级都尽可能的不影响到业务运行,甚至要求达到外界完全无感知的升级要求,这一点,就直接区别了小项目还是大项目,毕竟大系统所考虑的因素要远远多于单机发布的小项目。大小项目的常见区别有这么几个方面:磁盘大小(web,数据库,索引文件等),带宽大小,内存利用率,CPU利用率,并发连接数,分布式部署,负载均衡,缓存(dns,静态资源,数据库,文件等),数据库(IO,连接数,相应时间等),可用性要求。今天的文章暂不分析大小项目的区别,如果关注,请按照这几个方向去查询相关资料。


    一天当中的最佳升级时间点选择:对于大部分项目,都是跟着人的作息出现波峰波谷,因此对于一天当中的最佳升级时间点,自然而然也就是晚上最合适,常见的升级时间是凌晨开始,持续不超过4小时。如果超过4小时,则需要根据实际情况,预估升级时间,调整升级工作的开始时间。这是如何在一天的24小时内选择升级时间的重点考虑点。


    一周之间的最佳升级时间点:对于大部分企业型项目,周一到周五是使用的高峰期,周六周日骤然下降。因此显而易见,周末升级可以最少的减少升级工作带来的对整体业务的干扰。


    只考虑了一天和一周的最佳升级时间还远远不够,因为这只是笼统的一个总结。结合实际业务才是最重要的因素。本着“最小化影响范围”的原则。前面说到的两点,需要考虑在内。节假日也是个额外考虑的情况,例如某单位内部有十几个系统,OA,ERP,进销存,CRM等等。往往会为了统一资源,某些数据使用共同的低层支持系统,比如账号认证模块。这个时候需要根据业务多多考虑,如果出现意外情况,怎么快速联系到合作方系统的负责人进行验证和处理。升级前准备工作也是非常重要的环节,能否高覆盖面的预估出各种影响,是升级方案是否可行的关键,例如小编的openGPS.cn即将进行的一次磁盘扩容的升级计划,就需要规划如何完整全面的保留数据。扩容单盘需要停机格式化,数据怎么完整转移存储,初始化磁盘这个动作是需要格式化掉原有数据的,一旦操作不当数据全部丢失的风险会非常大。这是一点,升级步骤也是需要重点考虑的,继续以小编的openGPS.cn为例,升级通知需要提前发布,当然这个动作对于某些项目是不需要的。升级顺序:关停iis,挂载临时磁盘备份数据,打磁盘快照,购买磁盘,重启服务器,初始化新磁盘,数据拷贝,数据库实例恢复,iis恢复,用户验证。这个升级顺序不能乱序,不能遗漏。甚至每一步都不能出错。如果出现了任何一个意外情况不能继续往下执行,都首先考虑下是否需要紧急回滚磁盘快照。


    在小编参与过的系统升级中,普遍遵循的时间选择规则是:

    1,一般不选择周末加班升级。

     2,严禁周五升级。

     3,尽可能选择周二晚间升级。

    之所以选取这样的规则,是一种综合考虑的结果,周末加班,员工的心理会有抵触。周五升级,出现意外情况的响应速度太慢,如果意外情况延迟到周六,则员工的工作状态会明显降低。不选择周一开始,是为了做足准备工作,尽可能全面的考虑到升级工作可能带来的影响以及失败风险。


    对于特殊情况,要考虑的方面实在是太多,这里小编列举几点,分享给大家:

    1,半夜升级,如何维护晚间的维护类、分析类项目半夜停掉,但第二天完美继续运行

     2,半夜升级,出现跨系统状况,如何最快联系到相关人员确认分析原因,后续影响,应对方案,紧急补救措施。这时候常见做法是提前通知可能影响到的项目的负责人,甚至直接安排其待命。

     3,错误回滚,这里所要求的就是先备份再升级。来保障最糟糕的结果就是从这个备份时间点之前的数据仍然完整可回滚。

     4,升级完整度验证,如果跨项目,这里就需要其他项目负责人参与检查了

     5,发生升级失败的情况,回滚动作优先进行,避免工作人员超负荷工作下出现更多的错误产生。


原文地址: https://www.opengps.cn/Blog/View.aspx?id=12 文章的更新编辑依此链接为准。欢迎关注源站原创文章!

评论

暂无评论!

发表评论:

用于接收作者回复信息
点击更换验证码 - openGPS提示

AD