尊敬的 RoseTest 你好,你目前拥有 10243 分,快去兑换礼品吧!|  退出系统
您现在所在的位置:网站首页 >> 解决方案 >>方案内容

RoseHA(Multi-Node)集群高可用解决方案[2015-07-20]
RoseHA(Multi-Node)集群高可用解决方案
                               -----基于共享磁盘阵列

需求分析

用户环境
硬件环境
服务器: 4台PC服务器
磁盘阵列:1台磁盘阵列
软件环境
操作系统: linux、windows
OA:
数据库应用:

方案原理
RoseHA(Multi-Node)集群软件采用Rose自行研发的集群技术,可将企业多台提供网络资源的计算机,有效的组合成一个保证多个核心应用服务连续运营的高可用集群系统。它通过监控应用程序、数据库、操作系统、存储资源、客户端访问资源等各类计算机软件和硬件资源的运行状态,实现核心信息系统高可用性。当某个节点不可用或执行操作系统升级、应用程序补丁等需要主服务器脱机操作的日常维护工作时,RoseHA(Multi-Node)软件开始监控系统,通过私用网络传递的心跳信息,每台主机上的RoseHA自动将该台计算机的工作转移到集群中的其他可用节点继续运行,有效减少计划内和计划外宕机时间,提高了业务信息系统高可用性和稳定性。

方案描述
如上图所示,4台服务器分别连接共享存储,通过RoseHA(Multi-Node)的集群组工作模式配置OA系统集群和数据库集群的高可用资源,实现应用服务器相关应用资源热备份。具体实现方式如下:
1、 集群组内服务器均安装上相同的操作系统,都连接上磁盘阵列,盘阵做好RAID后,根据需要划分出存放数据文件的分区,并分别映射至各个服务器;
2、 集群组内服务器按照完全相同方式部署好相关应用程序,并确保应用服务可以单独启停和正常运行。
3、 集群组内所有服务器均部署RoseHA(Multi-Node)集群高可用软件。集群组内服务器之间用冗余网线(或者串口线)作为RoseHA(Multi-Node)的心跳线,传输相互之间的心跳信息。冗余心跳设计可以有效规避单点故障。
4、 客户端通过在RoseHA(Multi-Node)中配置的活动IP来访问相关应用服务。
5、 RoseHA(Multi-Node)通过Agent监控数据库等相关应用服务、网络和硬件等资源的运行状况,一旦发现生产服务器应用程序或者是主机硬件出现异常,RoseHA(Multi-Node)都会将相关资源从当前应用的主服务器切换到备服务器上继续运行,保证相关应用持续正常地运行。



方案效果
通过使用RoseHA(Multi-Node)高可用解决方案,可以实现以下效果:
1、实现了集群应用服务自动监测、自动切换当系统出现故障时(如:系统宕机、服务器硬件故障,应用进程被杀掉、存储连线/网络线缆断开),RoseHA(Multi-Node) 将确定由于某种故障而终止的应用,并将这些应用切换到备份服务器上。而故障服务器中未受影响的应用不会被切换,不受任何影响,也不需要系统管理员干预。并且,RoseHA(Multi-Node) 具有两个核心进程,他们互相监控,如果其中一个进程失败,另一个进程会立即进行恢复,防止了因RoseHA(Multi-Node)本身故障而引起切换的发生,完整容错机制使用用户对业务访问得到连续,从而保证整个系统持续运营。
2、实现集群心跳冗余
可将多组网线作为在集群系统上运行的RoseHA(Multi-Node)的心跳线,配置多条心跳路径可以避免系统的单点故障。
3、提高集群网络可靠性
如果服务器的网络部分发生故障,会导致客户不能连接和访问到服务器,这同样是致命的故障。RoseHA(Multi-Node)可以利用服务器配备的冗余网络接口,使用它来恢复网络连接。在没有配备冗余的网络接口,或者所有的网络接口均出现故障时,HA会将该应用切换到另外一台服务器上。切换完成后,客户在短暂的切换过程后能够继续访问所需的服务,提高用户整个系统网络可靠性。
4、增强集群磁盘可靠性
RoseHA(Multi-Node)支持DAS,NAS,SAN的存储架构,然后将应用的共享数据存储在两台服务器都能访问到的共享磁盘中。使用磁盘阵列来存储数据,这样可以避免单点失败,而且便于对系统的容量进行扩充。RoseHA(Multi-node)支持Windows平台动态卷组的共享卷切换,以及配合VERITAS Volume Manger管理的共享卷组切换。
5、提高了集群应用可靠性
在本案中,配置了CMS发布管理、资源系统等应用高可用资源,当集群中应用服务故障时,RoseHA(Multi-Node)会将该服务转移到备用服务器上,而备用服务器上的原有的应用不会受到影响,从而提高了整个应用的可靠性。
6、友好的管理界面,提高对故障进行监测、报警和恢复
RoseHA(Multi-Node) 提供了友好直观的图形安装界面和监控管理界面。通过直观而又方便的管理界面,用户可以交互式地对集群系统进行配置、监控和管理,并可以通过网络对系统进行远程管理,实时地显示出主机系统及服务的状态。通过GUI管理界面,还可以设定发生故障时预警邮件,通知管理员。如果故障资源恢复正常,GUI界面会自动恢复到正常状态。
7、独立的集群日志系统
RoseHA(Multi-node)拥有独立的集群日志系统,它实时报告集群环境的工作状态,包括集群节点的增减、应用服务状态、服务器硬件状态、网络状态等。管理员可以通过任意一台集群服务器,或远程访问等方式,监控查看整个集群的工作状态。当系统出现异常或无法正常运作时,可根据日志信息快速分析并排除故障,确保整个应用系统及时恢复。