MySQL之高可用集群部署及故障切換實(shí)現(xiàn)
一、MHA
1、概念
2、MHA 的組成
3、MHA 的特點(diǎn)
二、搭建MySQL+MHA
思路和準(zhǔn)備工作
1、MHA架構(gòu)
數(shù)據(jù)庫(kù)安裝
一主兩從
MHA搭建
2、故障模擬
模擬主庫(kù)失效
備選主庫(kù)成為主庫(kù)
原故障主庫(kù)恢復(fù)重新加入到MHA成為從庫(kù)
3、準(zhǔn)備4臺(tái)安裝MySQL虛擬機(jī)
MHA高可用集群相關(guān)軟件包
MHAmanager IP:192.168.221.30
MySQL1 IP:192.168.221.20
MySQL2 IP:192.168.221.100
MySQL3 IP: 192.168.221.110
1、關(guān)閉防火墻,檢測(cè)端口是否開(kāi)啟
systemctl stop firewalld systemctl disable firewalld setenforce 0 netstat -natp | grep 3306
2、修改mysql節(jié)點(diǎn)的主機(jī)名
mysql1(192.168.221.20)
hostnamectl set-hostname mysql1 su - hostnamectl set-hostname mysql2 su - hostnamectl set-hostname mysql3 su -
3、修改三臺(tái)MySQL服務(wù)器的主配置文件/etc/my.cnf,并創(chuàng)建命令軟鏈接
MySQL1 vim /etc/my.cnf [mysqld] server-id = 1 log_bin = master-bin log-slave-updates = true systemctl restart mysqld ln -s /usr/local/mysql/bin/mysql /usr/sbin/ ln -s /usr/local/mysql/bin/mysqlbinlog /usr/sbin/ MySQL2 vim /etc/my.cnf server-id = 2 #server-id = 3 MySQL3則為3,三臺(tái)服務(wù)器 server-id 不能一樣 log_bin = master-bin relay-log = relay-log-bin relay-log-index = slave-relay-bin.index systemctl restart mysqld ln -s /usr/local/mysql/bin/mysql /usr/sbin/ ln -s /usr/local/mysql/bin/mysqlbinlog /usr/sbin/
4、配置MySQL一主兩從
(1)所有MySQL服務(wù)器進(jìn)行MySQL授權(quán) mysql1(192.168.221.20) mysql2(192.168.221.100) mysql3(192.168.221.110) 3臺(tái)都要配置 mysql -uroot -p123 grant replication slave on *.* to 'myslave'@'192.168.221.%' identified by '123'; grant all privileges on *.* to 'mha'@'192.168.221.%' identified by 'manager'; grant all privileges on *.* to 'mha'@'mysql1' identified by 'manager'; grant all privileges on *.* to 'mha'@'mysql2' identified by 'manager'; grant all privileges on *.* to 'mha'@'mysql3' identified by 'manager'; flush privileges; show master status;
(2)在 Slave1、Slave2 節(jié)點(diǎn)執(zhí)行同步操作 change master to master_host='192.168.221.20',master_user='myslave',master_password='123',master_log_file='master-bin.000005',master_log_pos=1991; start slave; show slave status\G Slave_IO_Running: Yes Slave_SQL_Running: Yes #一般 Slave_IO_Running: No 的可能性: #網(wǎng)絡(luò)不通 #my.cnf配置有問(wèn)題 #密碼、file文件名、pos偏移量不對(duì) #防火墻沒(méi)有關(guān)閉
(3)Slave1、Slave2 節(jié)點(diǎn)設(shè)置為只讀模式 mysql2(192.168.221.100) mysql3(192.168.221.110) set global read_only=1; #改回讀寫狀態(tài)set global read_only=0;
(4)主從復(fù)制驗(yàn)證 mysql1(192.168.221.20) 創(chuàng)建庫(kù) create database srs; use test; create table test(id int); insert into test values(1); mysql2(192.168.221.100) mysql3(192.168.221.110) 查詢庫(kù)驗(yàn)證 show databases;
5、安裝 MHA 軟件
(1)所有服務(wù)器上都安裝 MHA 依賴的環(huán)境 MHAmanager(192.168.221.30) mysql1(192.168.221.20) mysql2(192.168.221.100) mysql3(192.168.221.110) 首先安裝 epel 源,需要在線源安裝 再在所有服務(wù)器上安裝 node 組件 #安裝在線源 mv /etc/yum.repos.d/repos.bak/CentOS-* /etc/yum.repos.d/ yum list yum install epel-release --nogpgcheck -y yum install -y perl-DBD-MySQL \ perl-Config-Tiny \ perl-Log-Dispatch \ perl-Parallel-ForkManager \ perl-ExtUtils-CBuilder \ perl-ExtUtils-MakeMaker \ perl-CPAN
(2)所有服務(wù)器安裝MHA node軟件包 MHAmanager(192.168.221.30) mysql1(192.168.221.20) mysql2(192.168.221.100) mysql3(192.168.221.110) 對(duì)于每個(gè)操作系統(tǒng)版本不一樣,這里 CentOS7.4 必須選擇 0.57 版本。 在所有服務(wù)器上必須先安裝 node 組件,最后在 MHA-manager 節(jié)點(diǎn)上安裝 manager 組件,因?yàn)?manager 依賴 node 組件。 #將軟件包mha4mysql-node-0.57.tar.gz放入/opt目錄下 cd /opt tar zxvf mha4mysql-node-0.57.tar.gz cd mha4mysql-node-0.57 perl Makefile.PL make && make install 在 MHA manager 節(jié)點(diǎn)上安裝 manager 組件 將軟件包mha4mysql-manager-0.57.tar.gz放入/opt目錄下 cd /opt tar zxvf mha4mysql-manager-0.57.tar.gz cd mha4mysql-manager-0.57 perl Makefile.PL make && make install #node組件安裝后也會(huì)在/usr/local/bin 下面會(huì)生成幾個(gè)腳本(這些工具通常由 MHAManager 的腳本觸發(fā),無(wú)需人為操作) #manager 組件安裝后在/usr/local/bin 下面會(huì)生成幾個(gè)工具
6、在所有服務(wù)器上配置無(wú)密碼認(rèn)證
(1)在 manager 節(jié)點(diǎn)上配置到所有數(shù)據(jù)庫(kù)節(jié)點(diǎn)的無(wú)密碼認(rèn)證 MHAmanager(192.168.221.30) ssh-keygen -t rsa #一路按回車鍵 ssh-copy-id 192.168.221.20 ssh-copy-id 192.168.221.100 ssh-copy-id 192.168.221.110 (2)在 mysql1 上配置到數(shù)據(jù)庫(kù)節(jié)點(diǎn) mysql2 和 mysql3 的無(wú)密碼認(rèn)證 ssh-keygen -t rsa mysql1(192.168.221.20) ssh-keygen -t rsa ssh-copy-id 192.168.221.100 ssh-copy-id 192.168.221.110 (3)在 mysql2 上配置到數(shù)據(jù)庫(kù)節(jié)點(diǎn) mysql1 和 mysql3 的無(wú)密碼認(rèn)證 mysql2(192.168.221.100) ssh-keygen -t rsa ssh-copy-id 192.168.221.20 ssh-copy-id 192.168.221.110 (4)在 mysql3 上配置到數(shù)據(jù)庫(kù)節(jié)點(diǎn) mysql1 和 mysql2 的無(wú)密碼認(rèn)證 mysql3(192.168.221.110) ssh-keygen -t rsa ssh-copy-id 192.168.221.20 ssh-copy-id 192.168.221.100 篇幅太長(zhǎng)不予演示
7、在 manager 節(jié)點(diǎn)上配置 MHA
MHAmanager(192.168.221.30) (1)在 manager 節(jié)點(diǎn)上復(fù)制相關(guān)腳本到/usr/local/bin 目錄 cp -rp /opt/mha4mysql-manager-0.57/samples/scripts /usr/local/bin #復(fù)制后會(huì)有四個(gè)執(zhí)行文件 ll /usr/local/bin/scripts/ (2)復(fù)制上述的自動(dòng)切換時(shí) VIP 管理的腳本到 /usr/local/bin 目錄,這里使用master_ip_failover腳本來(lái)管理 VIP 和故障切換 cp /usr/local/bin/scripts/master_ip_failover /usr/local/bin #先清空原有內(nèi)容 echo '' > /usr/local/bin/master_ip_failover #直接復(fù)制并修改vip相關(guān)參數(shù) vim /usr/local/bin/master_ip_failover #!/usr/bin/env perl use strict; use warnings FATAL => 'all'; use Getopt::Long; my ( $command, $ssh_user, $orig_master_host, $orig_master_ip, $orig_master_port, $new_master_host, $new_master_ip, $new_master_port ); #############################添加內(nèi)容部分######################################### my $vip = '192.168.221.200'; #指定vip的地址 my $brdc = '192.168.221.255'; #指定vip的廣播地址 my $ifdev = 'ens33'; #指定vip綁定的網(wǎng)卡 my $key = '1'; #指定vip綁定的虛擬網(wǎng)卡序列號(hào) my $ssh_start_vip = "/sbin/ifconfig ens33:$key $vip"; #代表此變量值為ifconfig ens33:1 192.168.221.200 my $ssh_stop_vip = "/sbin/ifconfig ens33:$key down"; #代表此變量值為ifconfig ens33:1 down my $exit_code = 0; #指定退出狀態(tài)碼為0 #my $ssh_start_vip = "/usr/sbin/ip addr add $vip/24 brd $brdc dev $ifdev label $ifdev:$key;/usr/sbin/arping -q -A -c 1 -I $ifdev $vip;iptables -F;"; #my $ssh_stop_vip = "/usr/sbin/ip addr del $vip/24 dev $ifdev label $ifdev:$key"; ################################################################################## GetOptions( 'command=s' => \$command, 'ssh_user=s' => \$ssh_user, 'orig_master_host=s' => \$orig_master_host, 'orig_master_ip=s' => \$orig_master_ip, 'orig_master_port=i' => \$orig_master_port, 'new_master_host=s' => \$new_master_host, 'new_master_ip=s' => \$new_master_ip, 'new_master_port=i' => \$new_master_port, ); exit &main(); sub main { print "\n\nIN SCRIPT TEST====$ssh_stop_vip==$ssh_start_vip===\n\n"; if ( $command eq "stop" || $command eq "stopssh" ) { my $exit_code = 1; eval { print "Disabling the VIP on old master: $orig_master_host \n"; &stop_vip(); $exit_code = 0; }; if ($@) { warn "Got Error: $@\n"; exit $exit_code; } exit $exit_code; } elsif ( $command eq "start" ) { my $exit_code = 10; eval { print "Enabling the VIP - $vip on the new master - $new_master_host \n"; &start_vip(); $exit_code = 0; }; if ($@) { warn $@; exit $exit_code; } exit $exit_code; } elsif ( $command eq "status" ) { print "Checking the Status of the script.. OK \n"; exit 0; } else { &usage(); exit 1; } } sub start_vip() { `ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`; } ## A simple system call that disable the VIP on the old_master sub stop_vip() { `ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`; } sub usage { print "Usage: master_ip_failover --command=start|stop|stopssh|status --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n"; }
mkdir /etc/masterha cp /opt/mha4mysql-manager-0.57/samples/conf/app1.cnf /etc/masterha echo '' > /etc/masterha/app1.cnf vim /etc/masterha/app1.cnf [server default] manager_log=/var/log/masterha/app1/manager.log manager_workdir=/var/log/masterha/app1 master_binlog_dir=/usr/local/mysql/data master_ip_failover_script=/usr/local/bin/master_ip_failover master_ip_online_change_script=/usr/local/bin/master_ip_online_change user=mha password=manager ping_interval=1 remote_workdir=/tmp repl_user=myslave repl_password=123 secondary_check_script=/usr/local/bin/masterha_secondary_check -s 192.168.221.100 -s 192.168.221.110 shutdown_script="" ssh_user=root [server1] hostname=192.168.221.20 port=3306 [server2] candidate_master=1 check_repl_delay=0 hostname=192.168.221.100 port=3306 [server3] hostname=192.168.221.110 port=3306 #--------------------------配置文件解釋-------------------------------------------------------------------------- [server default] manager_log=/var/log/masterha/app1/manager.log #manager日志 manager_workdir=/var/log/masterha/app1.log #manager工作目錄 master_binlog_dir=/usr/local/mysql/data/ #master保存binlog的位置,這里的路徑要與master里配置的binlog的路徑一致,以便MHA能找到 master_ip_failover_script=/usr/local/bin/master_ip_failover #設(shè)置自動(dòng)failover時(shí)候的切換腳本,也就是上面的那個(gè)腳本 master_ip_online_change_script=/usr/local/bin/master_ip_online_change #設(shè)置手動(dòng)切換時(shí)候的切換腳本 user=mha #設(shè)置監(jiān)控用戶root password=manager #設(shè)置mysql中root用戶的密碼,這個(gè)密碼是前文中創(chuàng)建監(jiān)控用戶的那個(gè)密碼 ping_interval=1 #設(shè)置監(jiān)控主庫(kù),發(fā)送ping包的時(shí)間間隔1秒,默認(rèn)是3秒,嘗試三次沒(méi)有回應(yīng)的時(shí)候自動(dòng)進(jìn)行failover remote_workdir=/tmp #設(shè)置遠(yuǎn)端mysql在發(fā)生切換時(shí)binlog的保存位置 repl_user=myslave #設(shè)置復(fù)制用戶的用戶 repl_password=123 #設(shè)置復(fù)制用戶的密碼 report_script=/usr/local/send_report #設(shè)置發(fā)生切換后發(fā)送的報(bào)警的腳本 secondary_check_script=/usr/local/bin/masterha_secondary_check -s 192.168.221.100 -s 192.168.221.110 #指定檢查的從服務(wù)器IP地址 shutdown_script="" #設(shè)置故障發(fā)生后關(guān)閉故障主機(jī)腳本(該腳本的主要作用是關(guān)閉主機(jī)防止發(fā)生腦裂,這里沒(méi)有使用) ssh_user=root #設(shè)置ssh的登錄用戶名 [server1] hostname=192.168.221.20 port=3306 [server2] hostname=192.168.221.100 port=3306 candidate_master=1 #設(shè)置為候選master,設(shè)置該參數(shù)以后,發(fā)生主從切換以后將會(huì)將此從庫(kù)提升為主庫(kù),即使這個(gè)主庫(kù)不是集群中最新的slave check_repl_delay=0 #默認(rèn)情況下如果一個(gè)slave落后master 超過(guò)100M的relay logs的話,MHA將不會(huì)選擇該slave作為一個(gè)新的master, 因?yàn)閷?duì)于這個(gè)slave的恢復(fù)需要花費(fèi)很長(zhǎng)時(shí)間;通過(guò)設(shè)置check_repl_delay=0,MHA觸發(fā)切換在選擇一個(gè)新的master的時(shí)候?qū)?huì)忽略復(fù)制延時(shí),這個(gè)參數(shù)對(duì)于設(shè)置了candidate_master=1的主機(jī)非常有用,因?yàn)檫@個(gè)候選主在切換的過(guò)程中一定是新的master [server3] hostname=192.168.221.110 port=3306
8、第一次配置需要在 Master 節(jié)點(diǎn)上手動(dòng)開(kāi)啟虛擬IP
Master(192.168.221.20) /sbin/ifconfig ens33:1 192.168.221.200/24
9、在 manager 節(jié)點(diǎn)上測(cè)試
(1)在 manager 節(jié)點(diǎn)上測(cè)試 ssh 無(wú)密碼認(rèn)證 MHAmanager(192.168.221.30) masterha_check_ssh -conf=/etc/masterha/app1.cnf #如果正常最后會(huì)輸出 successfully; #如果失敗可以去配置服務(wù)器無(wú)密碼認(rèn)證的地方看看有沒(méi)有問(wèn)題 (2)在 manager 節(jié)點(diǎn)上測(cè)試 mysql 主從連接情況 MHAmanager(192.168.221.30) masterha_check_repl -conf=/etc/masterha/app1.cnf #最后出現(xiàn) MySQL Replication Health is OK 字樣說(shuō)明正常; #出現(xiàn)MySQL Replication Health is NOT OK!的,可以去看一下mysql服務(wù)器上的軟鏈接是否少創(chuàng)建-->本文位置:2、修改三臺(tái)MySQL服務(wù)器的主配置文件/etc/my.cnf,并創(chuàng)建命令軟鏈接 (3)在 manager 節(jié)點(diǎn)上啟動(dòng) MHA MHAmanager(192.168.221.30) nohup masterha_manager --conf=/etc/masterha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/masterha/app1/manager.log 2>&1 & #------------------------組件解釋---------------------------------------------------------------------------------- --remove_dead_master_conf:該參數(shù)代表當(dāng)發(fā)生主從切換后,老的主庫(kù)的 ip 將會(huì)從配置文件中移除。 --manger_log:日志存放位置。 --ignore_last_failover:在缺省情況下,如果 MHA 檢測(cè)到連續(xù)發(fā)生宕機(jī),且兩次宕機(jī)間隔不足 8 小時(shí)的話,則不會(huì)進(jìn)行 Failover, 之所以這樣限制是為了避免 ping-pong 效應(yīng)。該參數(shù)代表忽略上次 MHA 觸發(fā)切換產(chǎn)生的文件,默認(rèn)情況下,MHA 發(fā)生切換后會(huì)在日志記目錄,也就是上面設(shè)置的日志app1.failover.complete文件,下次再次切換的時(shí)候如果發(fā)現(xiàn)該目錄下存在該文件將不允許觸發(fā)切換,除非在第一次切換后收到刪除該文件,為了方便,這里設(shè)置為--ignore_last_failover。
10、查看相關(guān)狀態(tài)
MHAmanager(192.168.221.30) 查看 MHA 狀態(tài),可以看到當(dāng)前的 master 是 Mysql1 節(jié)點(diǎn)。 masterha_check_status --conf=/etc/masterha/app1.cnf 查看 MHA 日志,也以看到當(dāng)前的 master 是 192.168.221.20 cat /var/log/masterha/app1/manager.log | grep "current master" 查看 Mysql1 的 VIP 地址,查看 Mysql1 的 VIP 地址 192.168.163.200 是否存在,這個(gè) VIP 地址不會(huì)因?yàn)?manager 節(jié)點(diǎn)停止 MHA 服務(wù)而消失。 ifconfig 補(bǔ)充:若要關(guān)閉 manager 服務(wù),可以使用如下命令。 masterha_stop --conf=/etc/masterha/app1.cnf 或者可以直接采用 kill 進(jìn)程 ID 的方式關(guān)閉。
三、故障模擬
1、故障模擬
(1)在 manager 節(jié)點(diǎn)上監(jiān)控觀察日志記錄 MHAmanager(192.168.221.30) tail -f /var/log/masterha/app1/manager.log
(2)在 Master 節(jié)點(diǎn) Mysql1 上停止mysql服務(wù) mysql1(192.168.221.20) systemctl stop mysqld 或 pkill -9 mysql 正常自動(dòng)切換一次后,MHA 進(jìn)程會(huì)退出。HMA 會(huì)自動(dòng)修改 app1.cnf 文件內(nèi)容,將宕機(jī)的 mysql1 節(jié)點(diǎn)刪除。
(3)查看 mysql2 是否接管 VIP mysql2(192.168.221.100) ifconfig
(4)回到manager 節(jié)點(diǎn)上監(jiān)控觀察日志記錄 tail -f /var/log/masterha/app1/manager.log 故障切換備選主庫(kù)的算法: 1、一般判斷從庫(kù)的是從(position/GTID)判斷優(yōu)劣,數(shù)據(jù)有差異,最接近于master的slave,成為備選主。 2、數(shù)據(jù)一致的情況下,按照配置文件順序,選擇備選主庫(kù)。 3、設(shè)定有權(quán)重(candidate_master=1),按照權(quán)重強(qiáng)制指定備選主。 (1)默認(rèn)情況下如果一個(gè)slave落后master 100M的relay logs的話,即使有權(quán)重,也會(huì)失效。 (2)如果check_repl_delay=0的話,即使落后很多日志,也強(qiáng)制選擇其為備選主。
2、故障修復(fù)
mysql1(192.168.221.20) (1)修復(fù)master systemctl restart mysqld netstat -natp | grep 3306
mysql2(192.168.221.100) (2)修復(fù)主從 在現(xiàn)主庫(kù)服務(wù)器 Mysql2查看二進(jìn)制文件和同步點(diǎn) mysql -uroot -p123 -e 'show master status;' #在數(shù)據(jù)庫(kù)中執(zhí)行show master status; 在原主庫(kù)服務(wù)器 mysql1 執(zhí)行同步操作 mysql1(192.168.221.20) change master to master_host='192.168.221.100',master_user='myslave',master_password='123',master_log_file='master-bin.000001',master_log_pos=1747; start slave; show slave status\G
(3)在 manager 節(jié)點(diǎn)上修改配置文件app1.cnf MHAmanager(192.168.221.30) 再把這個(gè)記錄添加進(jìn)去,因?yàn)樗鼨z測(cè)掉失效時(shí)候會(huì)自動(dòng)消失 vim /etc/masterha/app1.cnf …… secondary_check_script=/usr/local/bin/masterha_secondary_check -s 192.168.221.20 -s 192.168.221.110 ...... [server1] hostname=192.168.221.100 port=3306 [server2] candidate_master=1 check_repl_delay=0 hostname=192.168.221.20 port=3306 [server3] hostname=192.168.221.110 port=3306
(4)在 manager 節(jié)點(diǎn)上啟動(dòng) MHA MHAmanager(192.168.221.30) masterha_stop --conf=/etc/masterha/app1.cnf nohup masterha_manager --conf=/etc/masterha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/masterha/app1/manager.log 2>&1 & masterha_check_status --conf=/etc/masterha/app1.cnf
到此這篇關(guān)于MySQL之高可用集群部署及故障切換實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)MySQL 高可用集群部署內(nèi)容請(qǐng)搜索本站以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持本站!
版權(quán)聲明:本站文章來(lái)源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請(qǐng)保持原文完整并注明來(lái)源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來(lái)源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來(lái),僅供學(xué)習(xí)參考,不代表本站立場(chǎng),如有內(nèi)容涉嫌侵權(quán),請(qǐng)聯(lián)系alex-e#qq.com處理。