SQL Server 2017 Always On AG on Linux(五)配置监听器测试故障转移

  • Post author:
  • Post category:linux

久等了,还是把这次测试补充完整吧!

前面已经配置好了 AlwaysOn AG 和 Pacemaker ,但是还不能进行故障转移。为了设置高可用,需要添加侦听器,用侦听器去访问数据库。群集资源代理程序 mssql-server-ha 是 Pacemaker 和 SQL Server 之间的接口。现在将创建和配置SQL Server Always On Availability Group的过程,并将相应的侦听器作为群集资源。

 

选择任意一个节点来做配置:

1. 在Pacemaker上创建Always On Availability组资源

pcs resource create LINUX_SQLAG ocf:mssql:ag ag_name=LINUX_SQLAG master notify=true  

LINUX_SQLAG: Pacemaker 集群资源的名称(可不必与 AlwaysOn AG 的名称相同,此测试设置相同)
ocf:mssql:ag: 由mssql-server-ha提供的Open Cluster Framework(OCF)资源代理的名称
ag_name=LINUX_SQLAG:  AlwaysOn AG 的可用性组的名称
master:  将资源定义为 master/slave 克隆资源
notify=true: 

 

2. 为Always On Availability Group侦听器创建虚拟IP地址资源

pcs resource create AGListener_VIP ocf:heartbeat:IPaddr2 ip=192.168.2.119 cidr_netmask=24  

AGListener_VIP: 虚拟IP地址资源的名称
ocf:heartbeat:IPaddr2: 管理虚拟IPv4地址的Open Cluster Framework(OCF)资源代理的名称
ip=192.168.2.119: AlwaysOn AG 的可用性组的侦听器IP
cidr_netmask=24: AlwaysOn AG 的可用性组的侦听器子网掩码

 

3. 将Always On Availability Group资源配置为在与虚拟IP地址资源相同的计算机上运行

pcs constraint colocation add AGListener_VIP LINUX_SQLAG-master INFINITY with-rsc-role=Master  

AGListener_VIP:  虚拟IP地址资源的名称
LINUX_SQLAG-master:  AlwaysOn AG 资源的克隆别名
INFINITY:  分配给资源约束的分数;这意味着约束是必需的
with-rsc-role=Master: 约束的附加属性;这意味着此约束与主克隆(或Always On Availability Group主副本)相关联

 

由于Always On Availability Group侦听器名称只能将客户端应用程序重定向到主副本,因此可用性组和侦听器名称必须始终在同一群集节点中运行
 

4. 配置群集资源应该开始/停止的顺序

pcs constraint order promote LINUX_SQLAG-master then start AGListener_VIP

promote: 约束行为,将资源从slave 提升为 master 资源
LINUX_SQLAG-master: AlwaysOn AG 资源的克隆别名
start: 初步操作完成后下一步的动作
AGListener_VIP: 虚拟IP地址资源的名称
 

 

在WSFC中,事件序列如下:

停止当前主副本上的可用性组
在当前主副本上停止侦听器名称
在新的主副本上启动侦听器
在新主副本上启动可用性组

在侦听器名称上定义约束时,事件序列如下:

停止当前主副本上的虚拟IP地址资源
停止当前主副本上的可用性组
在新的主副本上启动虚拟IP地址资源
在新主副本上启动可用性组
 

5. 验证Always On可用性组配置是否正常

pcs status

SELECT @@SERVERNAME as replica_name, @@VERSION, host_platform, host_distribution, host_release
FROM sys.dm_os_host_info
GO  
SELECT a.name as AG_Name, a.cluster_type_desc,b.dns_name,c.ip_address, c.ip_subnet_mask
FROM sys.availability_groups a
INNER JOIN sys.availability_group_listeners b ON a.group_id=b.group_id
INNER JOIN sys.availability_group_listener_ip_addresses c ON b.listener_id=c.listener_id
GO

 

6. 自动故障转移测试

现在算是配置好了,可以模拟服务器宕机让其自动进行故障转移。现在主节点在 server112.kk.com 上,把这台服务器关机测试看看!!

 

将服务器关机:

shutdown now

同时查看侦听器的连接情况

可以看到侦听器中断了一会儿,主副本从 server112 自动切换到了 server111了!此时查看pcs状态,server112已经停止了,

# pcs status

Cluster name: LINUXHACLUSTER
Stack: corosync
Current DC: server111.kk.com (version 1.1.19-8.el7_6.4-c3c624ea3d) - partition with quorum
Last updated: Sat Aug 10 13:06:59 2019
Last change: Sun Apr 28 23:47:28 2019 by root via cibadmin on server111.kk.com

3 nodes configured
4 resources configured

Online: [ server111.kk.com server113.kk.com ]
OFFLINE: [ server112.kk.com ]

Full list of resources:

 Master/Slave Set: LINUX_SQLAG-master [LINUX_SQLAG]
     Masters: [ server111.kk.com ]
     Slaves: [ server113.kk.com ]
     Stopped: [ server112.kk.com ]
 AGListener_VIP	(ocf::heartbeat:IPaddr2):	Started server111.kk.com

Failed Actions:
* LINUX_SQLAG_monitor_10000 on server111.kk.com 'not running' (7): call=28, status=complete, exitreason='',
    last-rc-change='Sat Aug 10 11:46:21 2019', queued=5654ms, exec=5493ms


Daemon Status:
  corosync: active/disabled
  pacemaker: active/disabled
  pcsd: active/enabled

 

现在重启 server112 这台服务器,起来后如下脚本启动 群集 server112,一会儿后 server112 在群集中将作为 salve,数据库中将作为 辅助副本。

pcs cluster start server112.kk.com

 

7. 手动故障转移测试

现在主副本在 server111 上面了,我将切回到 server112 上,在任意节点执行:

pcs resource move LINUX_SQLAG-master server112.kk.com --master

一会后,发现副本角色进行了切换。AlwaysOn AG 的切换是通过系统命令去切换的,SSMS 操作界面禁用了次此操作。SQL Server Always On AG on Linux 配置起来确实麻烦,还需要基于linux的群集,了解相关命令。对习惯用windows处理的人员来说,运维是比较麻烦的。不过一个公司用什么样的环境,还是需要有熟悉的人员去处理,不了解的话还是用windows更好。2019年秋季,SQL Server 2019 将出正式版本了,SQL Server On container 将是未来的一个研究方向了。

 

 

 

 

 

 


版权声明:本文为kk185800961原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。