非金融类支付业务容灾方案解析

2018-01-16

方案对比说明:

一、采用存储设备自带的远程复制功能做异地容灾

非金融类支付业务容灾方案解析

   存储的远程复制功能,是基于磁盘阵列内置的软件授权激活模块来完成的数据远程复制功能,如采用存储的远程复制功能,会存在非常多的缺陷,同时此种解决方案已经被行业所放弃的一种数据异地复制方案,原因如下:

   1) 当生产存储与异地的存储设备进行远程复制时,生产存储的性能会下降约20%以上,在未上异地容灾时,本地存储的核心功能是满足生产系统对数据存储的性能要求,而一旦上了异地存储的数据复制,本地生产存储会成为一台发起端,读出本地的数据并发送至异地,本地的生产存储会形成新的读写性能要求,从而拖慢本地的存储性能;

   2) 数据丢失量大,由于本地存储的远程复制是基于落地至本地磁盘上的数据进行远程同步,而做为应用服务器上的应用缓存,如ORACLE的写缓存策略,服务器自带的内存以及存储设备上的缓存数据都无法在发生灾难时同步至异地机房;

   3) 快照策略,存储设备的快照策略是基于磁盘阵列的定时产生,与应用无关,即当快照到达触发时间时,会自动生成,此时应用服务器的数据是否完整的写入磁盘,快照策略不会顾及,所以形成的异地数据恢复无法确保一定可以恢复,无法做一致性保证(异地存储的数据恢复是以快照为单位进行);

   4) 应用的静态部署,当本地机房在部署完成后,异地机房的服务器需按照生产系统的操作系统及应用环境进行静态部署,只做数据的接管,当本地的应用系统在发生故障时,异地的应用系统有一定的机会也会发生故障,从而无法确保一个可以追溯的,可回滚的应用环境;

   5) 一荣俱荣,一损俱损,当生产环境发生中病毒,误删数据时,异地的容灾中心对应的也会中病毒和删除对应的数据,从而造成本地的异地出现相同的问题;


二、如果采用传统备份软件的模式

非金融类支付业务容灾方案解析

   采用传统的备份软件,由于备份软件的工作原理,如果采用实时备份,应用服务器则无法对外提供正常的业务工作,备份软件客户端会占用应用服务器cpu及内存25%左右的使用率;所以备份软件的备份策略一般为晚上12:00发起,此时业务系统几乎处于空闲状态,从而进行备份作业,如采用备份的方案,问题如下:

   1) 采用传统的备份方案由于备份策略一般为晚上12:00发起,所以一旦生产环境发生故障,数据丢失量约为一天的数据;

   2) 采用传统的备份方案,备份的数据无法实时使用,必须将备份数据恢复至某台服务器中,才可以使用,数据恢复时间长;

   3) 无法保护应用服务器,当应用服务器发生调整和改变时,备份软件无法感知,也无法保护,更无法对操作系统的历史版本进行保护、追溯及回滚;

   4) 无法经常对容灾中心业务的可恢复性进行演练;

三、解决方案

非金融类支付业务容灾方案解析


解决方案说明:

   1) 支付主机房采用了大量的冗余策略,确保主机房的绝对可靠性,本容灾方案对支付主机房没有过多调整和改变;

   2) 在异地的支付备机房,保留现有的网络和安全设备,所有服务器由一台服务器+数存容灾设备来承担即可;

   3) 在支付备机房的独立服务器上安装vmware虚拟化软件,作为支付主机房在应用、设备、站点发生故障时的业务发起端;

解决方案工作原理

1) 未发生故障时

   (1) 支付备机房的数存Datapp-CDP设备通过以太网或FC的方式从防护区、DMZ区、核心生产区以及运营管理和内部接出区的所有服务器操作系统、应用程序及数据全部同步至Datapp-CDP设备中;

   (2) 法规遵从,可以在Datapp-CDP设备中定义多块网卡,进行一一对应,如果在此领域有法规遵从的要求,Datapp-CDP可以定向保护某个区域或某部分设备均可以;数存Datapp-CDP是基于实时的同步策略,基本不会发生数据丢失;

   (3) 在每台服务器的每个逻辑磁盘中,比如windows下的C盘,D盘,E盘,以及linux下的SDA,SDB,SDC等,每个逻辑磁盘给予1000份可管理快照,确保在任意时刻,均有数据追溯和回滚的方式;

   (4) 应用服务器端可以设定实时同步、指定时间同步、数据变量阀值、指定同步带宽的策略向Datapp-CDP进行数据同步,灵活选择,比如操作系统可以设定每天12:00同步一次(仅同步差异量),数据库可以实时同步,而对于非关健应用则可以设定同步带宽不大于1M的策略等;

   (5) 在支付备机房的服务器安装vmware虚拟化平台,处于空转状态,等待支付主机房发生故障;


 2) 当支付主机房发生故障时

   (1) 某台服务器操作系统发生故障;支付备机房的Datapp-CDP已经保护了该服务器,则将Datapp-CDP里对应的操作系统指定给虚拟机,由vmware平台扫描、启动即可;

   (2) 当某台服务器硬件发生故障时;该服务器对应的操作系统、应用及数据全部被保护至支付备机房的Datapp-CDP设备中,将此部分数据指定给虚拟机,由vmware扫描、启动即可;

   (3) 当支付主机房中病毒时,由Datapp-CDP回退至前一个状态,指定给vmware虚拟化平台,由vmware平台描、启动即可,如使用原服务器的硬件平台,则将中病毒前的状态(快照)指定给该服务器并恢复即可;

   (4) 当支付主机房核心存储故障时,则由Datapp-CDP设备将存储对应的数据挂载至支付主机房的对应应用服务器上,由Datapp-CDP临时伴演支付主机房主存储的角色,继续工作;

   (5) 当支付主机房发生站点级故障时,即整个支付主机房瘫痪时,将支付备机房的Datapp-CDP上的所有操作系统、应用及数据全部指定给虚机,扫描、启动,由该虚机组合临时取代支付主机房的工作,数存Datapp-CDP本身是一台强大的存储产品,基独有的SafeCache和HotZone技术,确保Datapp-CDP可以做为第二生产中心,保障信息化的持续运营。


3) 恢复

   当支付主机房发生故障后,支付备机房已做为第二生产中心,对外提供服务,并形成了新的大量的数据,当支付主机房修复后,由支付备机房将所有服务器最新的操作系统、应用及数据再恢复至支付主机房,由主机房继续提供业务服务,支付备机房重新做为容灾保护中心实时同步,并时刻准备着容灾接管。


 4) 演练

   基于传统的备份方案及其它的备份方式,采用Datapp-CDP可以随时挂载,启动,Ok,即可完成一次机器的启动,整个演练过程在二十台机器以内,不超出1小时即可完成;


下一篇:这是最后一篇
上一篇:这是第一篇