目前,在已经应用网络技术环境的医院中,绝大多数用户都采用了群集技术(双机热备份)来保证服务的持续运行,或者在用户可以容忍的时间之内,自动进行服务恢复。群集技术在应对服务器故障方面有着显而易见的效果,这一技术已经得到了国内大多数用户的认可,并已经得到很大程度上的普及。传统的群集解决方案多采用“2+1”(即两台服务器间配一台磁盘阵列)的“双机热备份”模式,这个为了在两台服务器之间共享数据而存在的独立磁盘阵列,往往就成为了核心系统一个突出的故障点:一旦磁盘阵列发生故障,整个系统就会停机。作为7×24营业的医院来说,这种意外的停机对业务的影响可想而知。
宝德提出了N+2的集群解决办法,所谓“N+2”,就是“N个运算节点+两个存储节点”。 “N+2”群集模式是在原来的“N+1”群集模式的基础上,增加了一台磁盘阵列,院方将每一个刀片服定义为一个“运算节点”,而将每一台磁盘阵列定义为一个“存储节点”。 这套灾备系统除了采用性能稳定,安全性高的GS-5016SD的磁盘阵列,实现了两台磁盘阵列之间的镜像关系。每一次I/O的写入都分别通过两条主机通道到达两台磁盘阵列的控制器,并当两个I/O都返回正确的结果之后,操作才算完成。这样,两台磁盘阵列中的数据完全保持实时同步,不用担心任何的数据一致性问题。
心跳线使用千兆网卡直接使用网线连接配置成私有网络。刀片服务器通过SAS线缆连接到共享存储宝德GS-5016SD上。外网和内网同时监测的好处是避免了心跳线的单点故障,从而不会导致因心跳线故障而带来的误切换。当主机通过“心跳监测”一旦监测到主机出现故障时,备机将在线接管故障主机的所有工作包括在RAID 共享存储上的数据,不会中断正常的网络服务。共享存储自带RAID 控制器,能实现RAID0,1,5 等RAID 级别,用户可以选择适当的级别RAID 提高共享存储中数据的可用性和可靠性。