亲历宁夏银行800公里异地容灾实战演练

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:xpank
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  2010年4月24日下午,宁夏银行8楼会议室里一片寂静,一场灾难恢复实战演练即将开始。会场上的气氛略显紧张,因为这毕竟是在相距800公里的两个站点之间进行的异地灾难恢复实战演练。以前,这种演练在国内银行系统是比较少见的。来自国内30多家城市商业银行、农村信用社的IT管理人员注视着演练小组的一举一动。
  参与实战演练的全部是宁夏银行的人员,包括银行的管理人员、业务人员和技术人员。这样的演练能够真正考验宁夏银行应急管理组织架构中各相关部门的协同工作能力,让宁夏银行的灾难恢复相关技术人员能够熟悉灾难恢复的流程,同时也表明宁夏银行CDP应用级灾难恢复系统是一套简单易行且高效的灾难恢复系统。
  
  不能本末倒置
  
  为了保证此次实战演练的成功,宁夏银行做了精心的准备,并特意选择在下午交易接近结束时进行演练,避免对银行的交易造成影响。但是计划赶不上变化,因为种种原因,实战演练的时间提前了,本来准备下发的关于演练的内部通告也没有发出。因此,整个演练是在真实的银行交易过程中进行的,是一次名副其实的实战演练。
  第一个演练场景是模拟数据库系统瘫痪情况下的系统恢复。15∶48,演练正式开始。银行柜面业务人员在处理一笔交易时,发现交易无法正常进行,便及时向技术部门告警。15∶52,技术部门确认系统发生故障,并提请进行系统灾难恢复。15∶53,银行领导决定,启动灾难恢复流程。15∶58,技术部门完成CDP数据提取,并加载到主机上。15∶59,系统恢复成功,主机启动。16∶00,应用加载成功,业务可正常进行。16∶02,柜面业务人员验证交易成功,没有数据丢失。RPO为零,RTO为14分钟,完全满足宁夏银行灾难恢复系统的建设指标(RPO近似为零,RTO为60分钟)。
  保证业务连续性是降低银行运营风险、提升服务水平所必须的。在银行实现数据和系统大集中的背景下,信息安全显得尤为重要。灾难恢复和业务连续性计划是银行信息安全的最后一道屏障,对于风险防范具有十分重要的意义。
  宁夏银行信息技术部总经理王春表示:“通常情况下,硬件故障占40%,由人为误操作、应用程序故障或系统缺陷引起的逻辑故障占50%,而火灾、地震等大灾难发生的概率只有1%~2%。只有对面临的风险有清晰的认识,才能在建设灾难恢复系统时做到心中有数。”
  一提到灾难恢复,很多人首先想到的是建立异地的灾备中心。建设异地灾备中心,不仅投资巨大,而且只有在发生火灾、地震等大灾难时,异地灾备中心才能真正发挥作用。企业如果用90%的资金去防范1%~2%的风险,其实是本末倒置。宁夏银行从2005年开始在灾难恢复和业务连续性计划方面进行尝试,平均每年的IT预算达到3000万元。宁夏银行十分清楚,经常发生且对银行业务安全影响较大的风险是硬件设备故障和逻辑错误,而不是火灾、地震等大灾难。因此在灾难恢复系统建设方面,宁夏银行没有急于求成,建设一个异地的灾备中心,而是从防范最基本的硬件设备故障入手,按部就班地进行灾难恢复体系的建设。
  2006年,宁夏银行采用磁盘同步复制技术,消除了磁盘阵列存在的单点故障,同时综合运用快照、备份等数据保护技术,保障了银行存储系统的安全。2009年,为了拓展业务,宁夏银行在西安建立了分行,跨区经营促使宁夏银行将建立异地灾备中心的计划提上了议事日程。即使如此,宁夏银行也没有盲目行事,而是进行了充分的市场调研和风险评估,希望建设一个高性价比的异地灾备系统。
  建设一个异地灾备中心的投入非常大,包括基础设施建设成本、传输线路租用成本、运维成本等。宁夏银行因为在西安设立了分行,所以灾备中心的场所是现成的,这可以节省一大笔基础设施建设费用。宁夏银行在采用飞康CDP持续数据灾备技术的同时还采用了带宽精简技术,4M带宽就能满足灾备复制的基本要求,从而减少了带宽租用的成本。考虑到远程容灾的传输线路成本以及高昂的运维成本(可能达到千万元级),宁夏银行选择了更实用、更经济的CDP技术。
  
  非CDP不可?
  
  宁夏银行于2009年12月开始按照国家《信息系统灾难恢复规范》(GB/T 20988)灾难恢复第五级标准的相关要求,启动了异地灾备系统建设,灾备中心设在西安分行。考虑到要建立本地和异地一体化、分层次的灾难恢复系统,宁夏银行采用了能够覆盖所有灾难的CDP技术。飞康CDP技术具有精准任意时间点定位、分层次本地/异地双重恢复体系、全部灾难的防御能力、设备故障的业务不停顿能力以及远程带宽精简技术,因此受到了宁夏银行的青睐。
  针对宁夏银行的需求,飞康设计了一套灾难和故障防御并举、用户行使恢复地点选择权、任意历史点恢复、用户自行管理的集备份与远程容灾于一体的综合数据保护解决方案。在生产机房通过部署飞康CDP管理器网关,对核心数据库和应用系统以及开发测试系统提供本地的持续数据保护。在应用级灾备的异地机房,同样部署飞康CDP设备,保证异地的连续数据传输。一旦发生生产系统故障,宁夏银行既可以选择在本地立即恢复运行(一般在10分钟以内),也可以选择利用异地灾备中心的数据进行应用级恢复。在数据库瘫痪时,只要启用飞康的录像精细化回放技术,就可以在本地快速恢复系统。
  “按照《信息系统灾难恢复规范》的规定,最高的灾难恢复等级是6级,即RTO和RPO都为零。但实际情况是,国内最高等级的灾备中心也只能达到5 级。宁夏银行异地灾备系统的建设从实际需求出发,并不刻意追求过高的RTO和RPO指标。经过实际测算,我们目前可以容忍半小时以内的数据丢失量。”王春介绍说,“当初,我们之所以毫不犹豫地选择CDP技术,是因为CDP既可以实现硬件设备的故障恢复,也可以实现逻辑故障的恢复,并且能够实现生产中心与灾备中心的双向快速切换,在成本上也能满足我们的需要。”
  
  挑战800公里异地容灾
  
  在银行系统内部,同城灾难恢复的实战演练屡见不鲜。但是像宁夏银行这样进行800公里异地灾难切换演练的并不多 。宁夏银行模拟的第二个场景是火灾发生时的异地灾难恢复。
  16∶20,柜面业务人员发现交易故障,提请技术人员查看交易系统。16∶22,技术部门确认由于机房发生火灾,系统不能正常运行,提请进行异地切换。16∶26,领导发出异地切换指令,技术人员检查传输线路是否畅通,然后开始異地切换。16∶31,CDP系统在异地提取数据成功。16∶32,西安的灾备中心主机接管银川主生产中心的业务。16∶36,经过验证,切换成功,数据无丢失。演练结束,异地切换RTO为15分钟,RPO小于10分钟,完全满足宁夏银行异地灾备系统的建设目标。
  在短短1个小时的时间里,宁夏银行顺利地完成了数据库系统瘫痪和火灾情况下的灾备演练。此次演练验证了宁夏银行核心系统灾难备份技术方案的有效性以及灾难恢复策略的合理性和可操作性,并让宁夏银行的相关人员积累了灾难处理经验,进一步优化了其应急策略及预案。
  异地灾备系统的建设并不是终点。业务连续性的问题必须常抓不懈。王春表示:“现阶段,宁夏银行实现了核心业务和柜面业务的应用级容灾。未来,宁夏银行计划将POS机、ATM机、电话和网上银行等业务全部纳入到应用级容灾的保护范围之内。”
其他文献
普巴软件 F1软件开发平台(简称:F1平台),是业界领先的基于SOA架构的JavaEE快速应用开发平台,填补了国内JavaEE快速应用开发平台的空白,开创了企业级应用开发和协同管理的新时代,被业界誉为软件开发推进器。  F1平台采用先进的配置化、组件化设计理念和高级封装技术,积累了大量成熟而实用的应用组件,绝大多数开发与应用无需编码,开发人员无需懂Java即可进行所见即所得式的开发,使开发效率大大
电子商务将成为芜湖经济发展的重要推手  政协芜湖市常务副主席、芜湖承接上海产业转移工作领导小组组长 李铿    芜湖市委市政府一直把发展电子商务作为“数字芜湖”规划,以及国民经济和社会发展规划的重要组成部分,并在落实安徽省委省政府有关自主创新综合改革、产业转移示范区建设的措施和芜湖市实施“工业强市”和“三产兴市”的意见中已经加以明确。  本次芜湖市政府主办的皖江城市带电子商务发展论坛上,与会专家提
正如把一颗石子投向湖面,IBM“智慧的地球”新战略的推出将在业界激起一片波澜,对不同层级的IT服务商产生重要的影响。而作为一个颇具包容性的战略理念,“智慧的地球”涉及了更多领域的融合与应用,这无疑将使IT的影响溢出边界,与周边领域相融合,构建一个规模更大、层次更高的产业生态圈。当前适逢中国投资4万亿元,加大投资基础设施的建设和拉动内需,将是中国未来几年经济发展的重点,IBM“智慧的地球”又将如何切
10年前,人们还在为电影《楚门的世界》所展示的被监控的生活感到恐惧,现在人们对被监控已经习以为常。商场、体育馆、展览馆、银行、医院、车站、机场……这个世界早已布满摄像头。给摄像头加个芯片,这聪明起来的摄像头就可以做很多不可思议的事情。    2010年2月22日,北京市海淀区某派出所,十几名重案组警察正在对某小区刚刚发生的一起入室盗窃案进行调查,他们一遍一遍地回看该小区的监控录像,试图找出犯罪嫌疑
没有人会否认惠普是一个产品线长到令人惊叹的IT供应商,正因其“庞大”,其独特价值显而易见——可灵活组合自身产品,快速定制个性化解决方案。全局考量加上产品间底层优化,使惠普帮助企业用户降低IT管理的复杂度和运维成本时得心应手。  3月31日,惠普信息产品集团全线更新商用产品线,台式机、笔记本电脑、工作站、瘦客戶机、POS系统及采用触屏技术的数字标牌显示器等新品悉数亮相。这些产品如何形成解决方案实现简
“在宽带接入路由器领域,从2000年到2009年这十年可称作‘连通’时代;而由2010年起,这一领域则步入了‘监控与管理’时代,即中小企业路由器2.0时代已经到来。”成都飞鱼星科技开发有限公司总经理兼首席技术官周龙认为。    高性能结合内容安全    宽带接入路由器自在2000年出现之后得到了大力发展,虽然出现了多次技术变革,如多WAN口的出现、链路的负载均衡以及策略路由等,但这些新技术都是为路
实体店的成本远高于线上业务,这是不争的事实,在消费者消费需求低迷的情况下,淘宝拓展实体店并非明智之举。  ——本报记者李强强    淘宝要开实体店了,准备把成熟的C2C业务向线下拓展。此前,贝塔斯曼就在中国大力拓展其线下业务,并在北京、上海等地开始了多达21家实体店,成为B2C试水线下业务的先行者。然而,不幸的企业各有各的不幸,2008年下半年,贝塔斯曼郁闷地关掉了其21家实体店,最大的图书B2C
本报综合外电报道3月26日,西门子宣布计划对其国际业务部门实施调整,把国际业务部门重组为20个地区中心,其10个业务部将缩减至3 个。  据称,西门子这次重组是把几个国家的业务部门合并在一起。例如,它将把奥地利、匈牙利、罗马尼亚和捷克的业务部门合并组建东欧事业部,法国、意大利和西班牙的业务部门也将组建为一个地区中心,美国和德国等较大市场保持不变。西门子将在下月底公布公司新的编制。
你在逛街的时候,是否希望随时知道附近商场的促销打折信息?你去看一场精彩的足球赛,是否希望能在现场找到有着共同爱好却很少见面的球友?风头正劲的地理位置服务(Location Based Service,简称LBS)就可以满足你的这些需求。  如果说以谷歌公司为代表的搜索模式属于2.0时代的话,那么以LBS为代表的3.0时代的网络搜索有哪些特点?更加精确?更为互动?更重服务?    因Facebook
作为全球最大的软件巨头,微软始终舍不得放弃互联网这块蛋糕。尽管招式使尽,但微软互联网业务仍饱受指责:社交网络定位混乱,Live系列产品用户体验差,搜索市场业绩平平。  就在众人对微软失望不已时,最近,微软却频繁升级MSN,并不断强化其功能,而这些升级的指向很明确:社交网络。  微软的意图很明显:整合社交网络,曲线进攻互联网。社交服务会是微软互联网战略的良药吗?还是它会再次兵败旗倒呢?    MSN