您好!欢迎来到雷安! 注册 |   登录
您现在所在的位置:网站首页 >> 成功案例 >> 案例内容

RoseHA(Multi-node) 政府行业业务连续解决方案成功案例[2015-01-14]
---某省应急办 应急信息平台业务连续运营解决方案
客户简介
   某省人民政府应急管理办公室(简称某省应急办)是某省省级行政位,承担省政府总值班室工作,及时掌握和报告国内外、省内外相关重大情况和动态,协助省政府领导处置特别重大和重大突发公共事件,负责指导各地级以上市政府、省政府各部门应急体系、应急信息平台建设,协调和督促检查相关应急管理工作。
项目背景及需求分析
   省应急办负责指导本省各部门的应急体系,为了实现省应急中心与各部门应急体系进行高效实时互通和应急信息及时共享,省应急办需要建设高效、可靠的应急信息平台系统。为了实现应急平台的应用系统高靠,提出整个应急信息平台需要实现完全冗余,省应急中心搭建双机双柜集群,各部门应急体系搭建镜像集群。
应急信息平台的拓扑结构如下:

项目实施目标:
   保障省应急中心和各部门应急体系的应急信息平台能够不间断提供应用服务,为省应急办的重要工作提供信息技术支撑。
解决方案
   通过对该项目需求的详细分析,经过细致的产品对比、慎重的方案筛选,在省应急中心,Rose 公司隆重推出其采用基于共享存储的业务连续性旗舰产品RoseHA(Multi-node)和存储通道冗余路径产品RoseRP来实现双机双柜的高可用解决方案;在各部门应急体系,Rose公司推荐其采用基于数据镜像的业务连续性旗舰产品RoseMirrorHA。以下为该项目中省应急中心端双机双柜解决方案的说明。
双机双柜环境
硬件环境:
磁盘阵列柜HP EVA8400 2台
刀片服务器HP BL860C 2台
光纤交换机 2台
软件环境:
Windows 2008 R2
RoseHA(Multi-node) 9.0 for Windows
RoseRP 2.0 for Windows
Oracle 11g for Windows
双机双柜方案概述
   应急信息平台的后台数据库为Oracle 11g,Oracle 11g运行的操作系统平台为Windows 2008 R2,为了达到完全冗余的高可用集群需求,设计双机双柜方案,方案拓扑图如下。

   如上图所示,磁盘阵列A和磁盘阵列B分别接入不同的光纤存储交换机,服务器A和服务器B分别接入不同的光纤存储交换机;这种部署结构,实现了硬件设备和存储通道的完全冗余。
   在服务器A和B上部署RoseRP软件,将冗余路径映射的磁盘还原为实际磁盘,通过操作系统的磁盘管理工具将不同盘阵映射的磁盘创建为RAID 1镜像卷;分别在服务器上部署Oracle软件,实现Oracle的冗余部署,并将Oracle的数据存放至不同盘阵构成的镜像卷中;安装配置RoseHA(Multi-node), 实现对业务系统的高可用保护。
   在应用服务方面,如果出现应用服务故障,RoseHA(Multi-node)将及时监控到该故障情况,重启或切换应用服务。
   在服务器层面,如果服务器出现硬件故障,导致操作系统无法正常运行或启动,RoseHA(Multi-node)将自动将应用服务切换至备用服务器上。
   在存储方面,冗余的存储路径设计,有效避免了存储HBA卡、光纤存储交换机、磁盘阵列、存储通道单点故障的情况,完全冗余的双机双柜结构保证了业务系统的连续运营和业务系统的数据安全。
整体方案投入清单

双机双柜方案效果
实现结构全冗余
    双机双柜是完全冗余结构,有效避免了硬件设备和软件的单点故障。彻底解决了传统双机单柜模式下,磁盘阵列单点故障的情况。
高效、可靠的存储架构
   数据的存储架构为FC-SAN,通过RoseRP实现存储通道的负载冗余,提升了业务系统数据存储的可靠性、高效性、安全性,并且基于FC-SAN的架构具有高可扩展性。应用数据通过软RAID1的方式存储,在2个磁盘阵列上存储相同的数据,本地应用数据实现冗余存储,数据存储具有高安全特性。
集群节点易扩展
   RoseHA(Multi-node)为多节点高可用集群软件,支持在线扩展集群节点,易于该项目后期应用系统的集群扩展。
实现服务自动监测、自动切换
   当系统出现故障时(如:系统宕机、服务器硬件故障、应用进程异常、RS-232/存储连线/网络线缆断开),RoseHA(Multi-node)将确定由于某种故障而终止的应用,并将这些应用切换到备份服务器上。而故障服务器中未受影响的应用不会被切换,不受任何影响,也不需要系统管理员干预。并且,RoseHA(Multi-node)具有2个核心进程,他们互相监控,如果其中一个进程失败,另一个进程会立即进行恢复,防止了因RoseHA(Multi-node)本身故障而引起切换的发生。
实现心跳冗余
   支持多达3组的冗余心跳配置,以避免心跳通信的单点故障。
提高网络可靠性
   如果服务器的网络部分发生故障,会导致客户不能连接和访问到服务器,这同样是致命的故障。RoseHA(Multi-node)可以利用服务器配备的冗余网络接口,使用它来恢复网络连接。在没有配备冗余的网络接口,或者所有的网络接口均出现故障时,RoseHA(Multi-node)会将该应用切换到另外一台服务器上。切换完成后,客户在短暂的切换过程后能够继续访问所需的服务。
增强磁盘阵列可靠性
   RoseHA(Multi-node)支持DAS,SAN的存储架构,冗余的磁盘阵列结构,有效避免了传统双机结构中磁盘阵列的单点故障。使用磁盘阵列来存储数据,这样可以避免单点失败,而且便于对系统的容量进行扩充。对由Volume Manager管理的磁盘阵列,RoseHA(Multi-node)提供了相应的处理程序,以保证磁盘阵列及数据的可靠性。
友好的管理界面,提高对故障进行监测、报警和恢复
   RoseHA(Multi-node)提供了友好直观的图形安装界面和监控管理界面。通过直观而又方便的管理界面,用户可以交互式地对集群系统进行配置、监控和管理,并可以网络对系统进行远程管理,实时地显示出主机系统及服务的状态。通过GUI管理界面,还可以设定发生故障时预警邮件,通知管理员。如果故障资源恢复正常,GUI界面会自动恢复到正常状态。
方案总结
   首先,在全冗余的结构下,实现应急信息平台的业务连续性保障,满足了省应急办对于业务连续及数据保护的需求。
其次,该方案为应急信息平台做好了远程容灾拓展的第一步工作,有利于后期方案的整体扩展。Rose拥有自主知识产权的容灾产品有RoseReplicator(Enterprise)数据容灾备份软件、RoseDR本地群集异地灾难恢复软件以及RoseDataBack持续数据保护软件,可根据当前的应用系统需要,灵活部署各类Rose容灾软件,实现数据和应用的远程容灾。
   另外,整个方案是完全根据客户需求设计,双机双柜解决方案具有高容错、高安全、高性能等特性,为省应急办的重要工作提供了信息技术支撑。