周末来临的深夜,当人们熟睡之时,一群人为了工作依然挑灯夜战,恒丰银行的一场大型活动在夜幕中井然有序进行。11月25日凌晨2时至5时,恒丰银行总行领导亲自坐阵,信息科技部门、风险管理部、相关系统业务管理部门和相关分行等精诚合作,顺利完成了数据中心同城灾备切换演练。
这次演练意义非同寻常,不但进一步提高了恒丰银行IT服务连续性水平,检验了突发事件的应急处置能力,还验证了恒丰金融云高可用架构的有效性,切实保障了信息系统安全稳定运行。
团结合作、高效协同,多部门联合推进切换演练
本次演练模拟金融云黄务主生产中心业务网出现全局性故障的真实场景,在出现故障后快速实施整个网络区域的隔离,分钟级整体切换到金融云中金同城数据中心相对应网络区域,恢复120个核心重要业务应用系统的对外连接。这次演练,是恒丰银行黄务、中金同城双活运行的系统架构投产后的一次全面实战演练。为保证演练组织和实施过程的高效无缝衔接,恒丰银行专门成立了金融云数据中心黄务同城灾备切换演练指挥部,由恒丰银行首席信息官司继平担任总指挥,负责演练准备阶段的方案审批和演练实施阶段的指挥协调等,调动了全行30余个专业部门、18家一级分行,近500人参与,是恒丰银行有史以来规模最大的一次实战演练。
11月25日凌晨2点,恒丰银行首席信息官司继平发布指令启动切换演练,系统“一键式”自动完成切换和回切工作。演练覆盖了全行百余个应用系统,切换RTO(恢复时间目标)=5分钟、RPO(恢复点目标)=0,回切RTO=3分钟、RPO=0。在同城中心运行期间,烟台分行、昆明分行、北京分行和上海分行、四川广安村镇银行组织内部人员开展了柜面、网上银行、掌上银行、第三方支付、ATM和POS等渠道的真实交易业务验证。
科技引领、人才引领,依托金融云确保高可用
该次演练不仅是恒丰银行业务连续性建设的重要组成部分,也是恒丰金融云的里程碑式事件。恒丰金融云在设计之初,就用架构高可用、服务高可用代替设备高可用、专业高可用设计思想,自顶向下零基系统规划设计了新一代多数据中心多活部署架构,并对应用系统进行了全面的云化改造,采用负载均衡技术来实现应用的高可用性,确保重要应用系统具有本地高可用快速恢复、同城双活负载均衡自动切换、异地接近零数据丢失的快速灾备切换能力。
切换和回切过程,涉及到全行最重要的A、B类在内的120余个应用系统(占全行应用系统数量72%),整体业务恢复时间却达到了分钟级。如此规模的同城双活切换演练,对于配置管理和自动化能力的要求极高,需要依赖金融云IaaS+云平台的大力支持。通过恒丰银行自主研发的应用云管平台,对不同成熟度的云化改造的应用系统进行了统一软件建模、标准配置管理,实现一套标准化的“一键式”自动化切换方案适配绝大多数应用系统的的自动化切换,将传统手工或半自动流程变为全自动化操作,实现各个业务系统的并发切换,大大缩短了灾备系统的切换时间,提高了切换效率,达到了即切即用的水平。
此次演练的完成,标志着恒丰银行业务连续管理能力达到国内银行业先进水平,成为我国银行业中少数能够成功部署同城双活数据中心,并高效实施同城灾备切换演练的银行之一,不仅再次证明了金融云高可用、连续性架构的有效性,也体现了切换演练的实操性。