久等了,还是把这次测试补充完整吧!
前面已经配置好了 AlwaysOn AG 和 Pacemaker ,但是还不能进行故障转移。为了设置高可用,需要添加侦听器,用侦听器去访问数据库。群集资源代理程序 mssql-server-ha 是 Pacemaker 和 SQL Server 之间的接口。现在将创建和配置SQL Server Always On Availability Group的过程,并将相应的侦听器作为群集资源。
选择任意一个节点来做配置:
1. 在Pacemaker上创建Always On Availability组资源
pcs resource create LINUX_SQLAG ocf:mssql:ag ag_name=LINUX_SQLAG master notify=true
LINUX_SQLAG: Pacemaker 集群资源的名称(可不必与 AlwaysOn AG 的名称相同,此测试设置相同)
ocf:mssql:ag: 由mssql-server-ha提供的Open Cluster Framework(OCF)资源代理的名称
ag_name=LINUX_SQLAG: AlwaysOn AG 的可用性组的名称
master: 将资源定义为 master/slave 克隆资源
notify=true:
2. 为Always On Availability Group侦听器创建虚拟IP地址资源
pcs resource create AGListener_VIP ocf:heartbeat:IPaddr2 ip=192.168.2.119 cidr_netmask=24
AGListener_VIP: 虚拟IP地址资源的名称
ocf:heartbeat:IPaddr2: 管理虚拟IPv4地址的Open Cluster Framework(OCF)资源代理的名称
ip=192.168.2.119: AlwaysOn AG 的可用性组的侦听器IP
cidr_netmask=24: AlwaysOn AG 的可用性组的侦听器子网掩码
3. 将Always On Availability Group资源配置为在与虚拟IP地址资源相同的计算机上运行
pcs constraint colocation add AGListener_VIP LINUX_SQLAG-master INFINITY with-rsc-role=Master
AGListener_VIP: 虚拟IP地址资源的名称
LINUX_SQLAG-master: AlwaysOn AG 资源的克隆别名
INFINITY: 分配给资源约束的分数;这意味着约束是必需的
with-rsc-role=Master: 约束的附加属性;这意味着此约束与主克隆(或Always On Availability Group主副本)相关联
由于Always On Availability Group侦听器名称只能将客户端应用程序重定向到主副本,因此可用性组和侦听器名称必须始终在同一群集节点中运行
4. 配置群集资源应该开始/停止的顺序
pcs constraint order promote LINUX_SQLAG-master then start AGListener_VIP
promote: 约束行为,将资源从slave 提升为 master 资源
LINUX_SQLAG-master: AlwaysOn AG 资源的克隆别名
start: 初步操作完成后下一步的动作
AGListener_VIP: 虚拟IP地址资源的名称
在WSFC中,事件序列如下:
停止当前主副本上的可用性组
在当前主副本上停止侦听器名称
在新的主副本上启动侦听器
在新主副本上启动可用性组
在侦听器名称上定义约束时,事件序列如下:
停止当前主副本上的虚拟IP地址资源
停止当前主副本上的可用性组
在新的主副本上启动虚拟IP地址资源
在新主副本上启动可用性组
5. 验证Always On可用性组配置是否正常
pcs status
SELECT @@SERVERNAME as replica_name, @@VERSION, host_platform, host_distribution, host_release
FROM sys.dm_os_host_info
GO
SELECT a.name as AG_Name, a.cluster_type_desc,b.dns_name,c.ip_address, c.ip_subnet_mask
FROM sys.availability_groups a
INNER JOIN sys.availability_group_listeners b ON a.group_id=b.group_id
INNER JOIN sys.availability_group_listener_ip_addresses c ON b.listener_id=c.listener_id
GO
6. 自动故障转移测试
现在算是配置好了,可以模拟服务器宕机让其自动进行故障转移。现在主节点在 server112.kk.com 上,把这台服务器关机测试看看!!
将服务器关机:
shutdown now
同时查看侦听器的连接情况:
可以看到侦听器中断了一会儿,主副本从 server112 自动切换到了 server111了!此时查看pcs状态,server112已经停止了,
# pcs status
Cluster name: LINUXHACLUSTER
Stack: corosync
Current DC: server111.kk.com (version 1.1.19-8.el7_6.4-c3c624ea3d) - partition with quorum
Last updated: Sat Aug 10 13:06:59 2019
Last change: Sun Apr 28 23:47:28 2019 by root via cibadmin on server111.kk.com
3 nodes configured
4 resources configured
Online: [ server111.kk.com server113.kk.com ]
OFFLINE: [ server112.kk.com ]
Full list of resources:
Master/Slave Set: LINUX_SQLAG-master [LINUX_SQLAG]
Masters: [ server111.kk.com ]
Slaves: [ server113.kk.com ]
Stopped: [ server112.kk.com ]
AGListener_VIP (ocf::heartbeat:IPaddr2): Started server111.kk.com
Failed Actions:
* LINUX_SQLAG_monitor_10000 on server111.kk.com 'not running' (7): call=28, status=complete, exitreason='',
last-rc-change='Sat Aug 10 11:46:21 2019', queued=5654ms, exec=5493ms
Daemon Status:
corosync: active/disabled
pacemaker: active/disabled
pcsd: active/enabled
现在重启 server112 这台服务器,起来后如下脚本启动 群集 server112,一会儿后 server112 在群集中将作为 salve,数据库中将作为 辅助副本。
pcs cluster start server112.kk.com
7. 手动故障转移测试
现在主副本在 server111 上面了,我将切回到 server112 上,在任意节点执行:
pcs resource move LINUX_SQLAG-master server112.kk.com --master
一会后,发现副本角色进行了切换。AlwaysOn AG 的切换是通过系统命令去切换的,SSMS 操作界面禁用了次此操作。SQL Server Always On AG on Linux 配置起来确实麻烦,还需要基于linux的群集,了解相关命令。对习惯用windows处理的人员来说,运维是比较麻烦的。不过一个公司用什么样的环境,还是需要有熟悉的人员去处理,不了解的话还是用windows更好。2019年秋季,SQL Server 2019 将出正式版本了,SQL Server On container 将是未来的一个研究方向了。