首页 > 成功案例 > 青海农信-数据中心基础架构规划
项目背景

青海省农村信用社联合社(以下简称“青海农信”)是经省委、省政府同意,报中国银行业监督管理委员会批准成立,具有独立法人资格的省级地方性金融机构,受省政府委托,履行对全省农村商业银行、农村信用联社的管理、指导、协调、服务职能。青海省农村信用社经过60多年的发展,由青海省农村信用社联合社和30家农村商业银行(农村信用联社)组成,营业网点达371个,从业人员近5000人,资产总额突破1200亿,存贷款规模、经营效益均位居全省银行同业前列,是全省营业网点最多、覆盖面最广、支农力度最强,服务最贴近群众的地方性金融机构。

随着监管要求的不断升级和全省农信社系统业务的不断发展,为了保障信息系统平稳可持续运行,进一步提高业务连续性水平,青海农信提出灾备系统完善需求,进一步提高灾备系统覆盖面,实现应用系统“生产+灾备”集群运行模式,完成“两地三中心”建设。

项目挑战

数据高可用:信息化 时代,信息数据是金融业的命脉,制定业务连续性技术方案首先需要解决的是数据问题,客户数据、交易数据、生产数据一旦全部或部分丢失、遭到破坏等,对自身的打击是致命性的。因此需要设计高效可靠的数据保护架构为数据保驾护航。

灾备资源高效利用:为了保证业务的连续性,需要部署双活数据中心,传统的数据中心解决方案,正常情况下只有主数据中心投入生产,备数据中心处于待命状态。发生灾难时,灾备数据中心可以短时间内恢复业务并投入生产,减轻灾难带来的损失。这种模式只能解决业务连续性的需求,但恢复生产需要一定的时间,无法快速恢复生产。灾备中心建设的投资巨大且运维成本高昂,正常情况下灾备中心不对外服务,资源利用率低下,造成了巨大的浪费。因此数据中心架构设计需要考虑充分利用灾备IT资源,提高TI资源使用率,降低灾难恢复RTO。

项目亮点

存储高可用:青海农信现有4台EMC高端存储用来承载生产数据中心、同城灾备数据中心、异地灾备数据中心的业务数据。生产数据中心2台存储通过SRDF/METRO技术实现本地存储双活;同城灾备数据中心1台存储通过SRDF/A技术实现数据复制保护;异地灾备数据中心1台存储通过SRDF/A技术实现数据复制保护。

平台云化:通过云计算技术,实现资源分配的高弹性高扩展性。满足互联网时代业务对技术架构的高并发、快速响应、高可靠、海量存储等要求。青海农信构建了三朵私有云,其中生产数据中心部署1套私有云,上面承载大部分业务系统;灾备数据中心部署2套私有云,其中1套用以部署双活的应用系统,平时和生产数据中心一起对外提供服务,这两朵云互为备份,另外1套用以部署开发测试业务,为开发测试提供快速、统一部署。

双活数据中心:所谓“双活”或“多活”数据中心,区别于传统数据中心和灾备中心的模式,前者 多个或两个数据中心都处于运行当中,运行相同的应用,具备同样的数据,能够提供跨中心业务负载均衡运行能力,实现持续的应用可用性和灾难备份能力,所以称为“双活”和“多活”;后者是生产数据中心投入运行,灾备 数据中心处在不工作状态,只有当灾难发生时,生产数据中心瘫痪,灾备中心才启动。“双活”数据中心最大的特点是:一、充分利用资源,避免了一个数据中心常年处于闲置状态而造成浪费,通过资源整合,“双活”数据中心的服务能力是翻倍的;二、“双活”数据中心如果断了一个数据中心,其业务可以迅速 切换到另外一个正在运行的数据中心,切换 过程对用户来说是不可感知的。

两地三中心灾备架构:两地三中心:两地是指同城、异地;三中心是指生产中心、同城容灾中心、异地容灾中心。青海农信计划建成同城应用级、灾备数据级的两地三中心灾备体系,其中同城灾备系统将达到国家5级标准。

项目收益

数据的多重保护:通过建设同城灾备数据中心和异地灾备数据中心,将数据物理隔离保护,一份数据同时存于在3个数据中心,提高了数据应对风险的能力。 项目将从存储底层和数据库两个维度给数据提供全方位的保护。 采用存储的底层保护技术,实现生产数据中心本地存储双活,有效应对了本地存储单点故障,同时将存储实时复制到同城灾备数据中心和移动灾备数据中心,实现数据的异地备份,有效应对了生产数据中心的整体故障,以及地区自然灾害引发的数据丢失风险。 采用数据库逻辑复制保护技术,弥补传统存储复制灾备模式不能隔离任何数据库逻辑错误的缺陷,数据库逻辑复制传输的是与业务逻辑完整性相关的日志文件,而且传输之前对日志文件的完整性进行了校验,可以隔离所有的物理错误和绝大多数的逻辑错误,使得数据安全性得到有效提高。

双活架构:两个数据中心(同城/灾备)的应用都处于活动状体,都有业务对外提供服务且互为备份。但出于技术成熟度、成本、运维复杂度等因素考虑,数据库采用主备方式部署,数据库读写操作都在主数据中心进行,灾备中心进行数据同步。当灾难发生时,灾备数据中心的数据库可以快速切换,避免业务中断。双活数据中心可充分利用闲置资源,保证业务的连续性,帮助客户快速恢复生产,进一步降低RTO。