數(shù)據(jù)庫的高可用:MHA
MHA能夠在較短的時間內實現(xiàn)自動故障檢測和故障轉移,通常在10-30秒以內
MHA的工作原理:
當Master出現(xiàn)故障時,
它可以自動將最新數(shù)據(jù)的Slave提升為新的Master,
然后將所有其他的Slave重新指向新的Master.
MHA工作原理(詳解):
1)把宕機的master二進制日志保存下來。
2)找到binlog位置點最新的slave辰晕。
3)在binlog位置點最新的slave上用relay log(差異日志)修復其它slave憎瘸。
4)將宕機的master上保存下來的二進制日志恢復到含有最新位置點的slave上
5)將含有最新位置點binlog所在的slave提升為master肢执。
6)將其它slave重新指向新提升的master,并開啟主從復制。
MHA的架構:
1.MHA manager 可以安裝在任意一臺服務器上
2.一個MHA manager可以管理多套MySQL集群(上百套)
3.MHA manager 盡量避免安裝在主庫上(防止主庫斷電,斷網(wǎng))
4.MHA是一個C/S 結構的服務
MHA優(yōu)點總結:
1)自動故障轉移快(10-30)
2)主庫崩潰不存在數(shù)據(jù)一致性問題
3)不需要對當前mysql環(huán)境做重大修改
4)不需要添加額外的服務器(僅一臺manager就可管理上百個replication)
5)性能優(yōu)秀,可工作在半同步復制和異步復制乡翅,gtid,當監(jiān)控mysql狀態(tài)時,僅需要每隔N秒向master發(fā)送ping包(默認3秒)罪郊,所以對性能無影響蠕蚜。你可以理解為MHA的性能和簡單的主從復制框架性能一樣。
6)只要replication支持的存儲引擎悔橄,MHA都支持靶累,不會局限于innodb
通過解壓MHA源碼包,了解MHA manager工具(下載rpm包)
https://github.com/yoshinorim/mha4mysql-manager/wiki/Downloads
[root@db-01 ~]# tar xf mha4mysql-manager-0.56.tar.gz
[root@db-01 bin]# ll /root/mha4mysql-manager-0.56/bin
masterha_check_repl #檢查replication(主從復制)
masterha_check_ssh #檢查ssh(檢測免密)
masterha_check_status #檢查MHA的啟動狀態(tài)狀態(tài)
masterha_conf_host #配置主機信息
masterha_manager #MHA manager啟動程序
masterha_master_monitor #檢測主庫心跳
masterha_master_switch #切換主機
masterha_secondary_check #建立TCP連接
masterha_stop #停止MHA
通過解壓MHA源碼包,了解MHA node工具
[root@db-01 ~]# tar xf mha4mysql-node-0.56.tar.gz
[root@db-01 bin]# ll /root/mha4mysql-node-0.56/bin
apply_diff_relay_logs #對比中繼日志
filter_mysqlbinlog #防止binlog回滾 rollback
purge_relay_logs #刪除relay-log腺毫,###關閉自動清除relay-log的功能
save_binary_logs #保存binlog日志
1.進入主庫查看GTID是否開啟
mysql> show variables like '%gtid%';
+---------------------------------+-----------+
| Variable_name | Value |
+---------------------------------+-----------+
| enforce_gtid_consistency | OFF |
| gtid_mode | OFF |
+---------------------------------+-----------+
先決條件:
主庫:
1.開啟binlog
2.開啟server_id
3.創(chuàng)建主從復制用戶
從庫:
1.也需要開啟binlog
2.開啟server_id:從庫與主庫之間server_id 不同即可,從庫也不可以相同
3.change master to
4.在做主從之前,要保證主從數(shù)據(jù)的一致性
5.從庫也要創(chuàng)建主從復制用戶
主庫配置文件:(如果不用gtid做主從同步,不要要加gtid_mode=on挣柬,enforce_gtid_consistency潮酒,log-slave-updates這三個參數(shù),)就是普通搭建自從復制邪蛔,但是需要開啟binlog日志
[root@db-01 data]# vim /etc/my.cnf
[mysqld]
server_id=1
log-bin=mysql-bin
binlog_format=row #binlog為row行級模式
relay_log_purge = 0 #關閉MySQL自動清除relaylog的功能
gtid_mode=on #開啟gtid模式
enforce_gtid_consistency #開啟gtid
log-slave-updates #更新從庫binlog日志
從庫01配置:
[root@db-02 ~]# vim /etc/my.cnf
[mysqld]
server_id=2
gtid_mode=on
enforce_gtid_consistency
log-bin=mysql-bin
binlog_format=row
log-slave-updates
relay_log_purge = 0
從庫02配置:
[root@db-03 ~]# vim /etc/my.cnf
[mysqld]
server_id=3
gtid_mode=on
enforce_gtid_consistency
log-bin=mysql-bin
binlog_format=row
log-slave-updates
relay_log_purge = 0
3.創(chuàng)建主從復制用戶:(如果從庫同步這個用戶急黎,則不用創(chuàng)建,反之創(chuàng)建店溢,并檢查)
grant replication slave on *.* to rep@'172.16.1.5%' identified by '123';
開啟主從復制(如果不用gtid需要指定master_log_file叁熔,master_log_pos,并把master_auto_position=1 去除)
change master to
master_host='172.16.1.51',
master_user='rep',
master_password='123',
master_auto_position=1;
開啟SQL線程和IO線程
start slave;
查看狀態(tài)
show slave status\G
Slave_IO_Running: YES
Slave_SQL_Running: YES
下載MHA工具包(下載rpm包)
https://github.com/yoshinorim/mha4mysql-manager/wiki/Downloads
部署node節(jié)點(3臺):
yum install perl-DBD-MySQL -y
[root@db-01 ~]# yum localinstall -y mha4mysql-node-0.56-0.el6.noarch.rpm
[root@db-02 ~]# yum localinstall -y mha4mysql-node-0.56-0.el6.noarch.rpm
[root@db-03 ~]# yum localinstall -y mha4mysql-node-0.56-0.el6.noarch.rpm
部署manager節(jié)點委乌,(盡量不要在主庫上安裝)
yum install -y perl-Config-Tiny epel-release perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes
[root@db-03 ~]# yum localinstall -y mha4mysql-manager-0.56-0.el6.noarch.rpm
10.0.0.51:主庫
node節(jié)點
10.0.0.52:從庫01
node節(jié)點
10.0.0.53:從庫02
node節(jié)點
manager節(jié)點
1.需要添加一個MHA的管理賬號(所有主從服務器):
grant all on *.* to mha@'172.16.1.5%' identified by 'mha';
2.做命令的軟連接,3臺都需要做(mysql存放的位置需要自行修改)
[root@db-01 ~]# ln -s /usr/local/mysql/bin/mysqlbinlog /usr/bin/
[root@db-01 ~]# ln -s /usr/local/mysql/bin/mysql /usr/bin/
3.編寫MHA配置文件
在安裝manager節(jié)點的機器上,創(chuàng)建mha配置文件目錄
[root@db-03 ~]# mkdir /etc/mha/
[root@db-03 ~]# vim /etc/mha/app1.cnf
[server default]
manager_workdir=/etc/mha/app1 #設置manager的工作目錄
manager_log=/etc/mha/manager.log #設置manager的日志
master_binlog_dir=/data/mysql #設置master保存binlog的位置床牧,以便MHA可以找到master的日志,我這里的也就是mysql的數(shù)據(jù)目錄(如果mysql安裝的目錄不同遭贸,需要把它寫到對應的server下面)
ping_interval=2 #設置監(jiān)控主庫的時間
master_ip_failover_script= /etc/mha/master_ip_failover #設置VIP自動切換腳本
password=mha #設置mysql中mha用戶的密碼戈咳,這個密碼是前文中創(chuàng)建監(jiān)控用戶的那個密碼
user=mha #設置監(jiān)控用戶mha
ping_interval=1 #設置監(jiān)控主庫,發(fā)送ping包的時間間隔壕吹,嘗試三次沒有回應的時候自動進行failover
remote_workdir=/tmp #設置遠端mysql在發(fā)生切換時binlog的保存位置
repl_password=123456 #設置復制用戶的密碼
repl_user=rep #設置復制環(huán)境中的復制用戶名
ssh_user=root #設置ssh的登錄用戶名
[server1]
#candidate_master=1 #主庫宕機則設置此參數(shù)者為下個主庫著蛙,#默認情況下如果一個slave落后master 100M的relay-log,MHA將不會選擇該slave作為一個新的master
#check_repl_delay=0 #忽略落后100M
hostname=172.16.1.51
port=3306
[server2]
hostname=172.16.1.52
port=3306
[server3]
hostname=172.16.1.53
port=3306
提升為主庫:數(shù)據(jù)量一樣的情況下,根據(jù)server標簽來切換的.標簽越小優(yōu)先級越高
#######檢查文件后面不能有空格(每行字符都有一個$即可)
cat -A /etc/mha/app1.cnf
4.做ssh 免密登錄(下面4條命令,3臺都執(zhí)行)
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa >/dev/null 2>&1 #創(chuàng)建密鑰對
ssh-copy-id -i /root/.ssh/id_dsa.pub root@172.16.1.51 #推送秘鑰
ssh-copy-id -i /root/.ssh/id_dsa.pub root@172.16.1.52
ssh-copy-id -i /root/.ssh/id_dsa.pub root@172.16.1.53
5.MHA啟動前檢測
[root@db-03 ~]# masterha_check_ssh --conf=/etc/mha/app1.cnf #successful即可
[root@db-03 ~]# masterha_check_repl --conf=/etc/mha/app1.cnf #health is ok 即可
6.啟動MHA
nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /etc/mha/manager.log 2>&1 &
masterha_manager #MHA的啟動程序
--conf=/etc/mha/app1.cnf #指定配置文件
--remove_dead_master_conf #移除宕機的server標簽從配置文件里
--ignore_last_failover #忽略上一次的切換
< /dev/null > /etc/mha/manager.log 2>&1 &
MHA的工作機制:
1.完成一次切換后,會生成一個鎖文件在工作目錄中
2.下次切換之前,會檢測鎖文件是否存在
3.如果鎖文件存在,8個小時之內不允許第二次切換
7.檢測MHA啟動狀態(tài)
[root@db-03 ~]# masterha_check_status --conf=/etc/mha/app1.cnf
app1 (pid:49497) is running(0:PING_OK), master:172.16.1.51
停止
masterha_stop --conf=/etc/mha/app1.cnf
MHA環(huán)境修復步驟:
1.修復宕機的主庫
2.在MHA的日志中,找到change master 語句
[root@db-03 ~]# grep -i 'change master to' /etc/mha/manager.log
Thu Jul 25 04:38:35 2019 - [info] All other slaves should start replication from here. Statement should be: CHANGE MASTER TO MASTER_HOST='172.16.1.52', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='rep', MASTER_PASSWORD='xxx';
3.在宕機的主庫中執(zhí)行,并修改密碼
CHANGE MASTER TO MASTER_HOST='172.16.1.52', MASTER_PORT=3306, MASTER_AUTO_POSITION=1, MASTER_USER='rep', MASTER_PASSWORD='xxx';
4.開啟IO和SQL線程,將宕機的主庫重新加入集群變成從庫
start slave
5.在manager配置文件中把宕機主句的server標簽加回來
[root@db-03 ~]# vim /etc/mha/app1.cnf
[server1]
hostname=172.16.1.51
port=3306
6.啟動MHA
[root@db-03 ~]# nohup masterha_manager --conf=/etc/mha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /etc/mha/manager.log 2>&1 &
7.檢測MHA啟動狀態(tài)
[root@db-03 ~]# masterha_check_status --conf=/etc/mha/app1.cnf
app1 (pid:50155) is running(0:PING_OK), master:172.16.1.52
VIP虛擬IP漂移(前端連接數(shù)據(jù)庫的IP指向虛擬IP)
根據(jù)manager配置文件寫對應的腳本
[root@db-03 ~]# vim /etc/mha/app1.cnf
master_ip_failover_script= /etc/mha/master_ip_failover #設置VIP自動切換腳本
[root@db-03 ~]# vim /etc/mha/master_ip_failover
#!/usr/bin/env perl
use strict;
use warnings FATAL => 'all';
use Getopt::Long;
my (
$command, $ssh_user, $orig_master_host, $orig_master_ip,
$orig_master_port, $new_master_host, $new_master_ip, $new_master_port
);
my $vip = '172.16.1.55/24'; #虛擬IP地址
my $key = '1';
my $ssh_start_vip = "/sbin/ifconfig eth1:$key $vip";
my $ssh_stop_vip = "/sbin/ifconfig eth1:$key down";
#(如果端口不是22耳贬,管理用戶不是root需要添加 原端口my $orig_master_port=, 新端口$new_master_port 和用戶$ssh_user,)
GetOptions(
'command=s' => \$command,
'ssh_user=s' => \$ssh_user,
'orig_master_host=s' => \$orig_master_host,
'orig_master_ip=s' => \$orig_master_ip,
'orig_master_port=i' => \$orig_master_port,
'new_master_host=s' => \$new_master_host,
'new_master_ip=s' => \$new_master_ip,
'new_master_port=i' => \$new_master_port,
);
exit &main();
sub main {
print "\n\nIN SCRIPT TEST====$ssh_stop_vip==$ssh_start_vip===\n\n";
if ( $command eq "stop" || $command eq "stopssh" ) {
my $exit_code = 1;
eval {
print "Disabling the VIP on old master: $orig_master_host \n";
&stop_vip();
$exit_code = 0;
};
if ($@) {
warn "Got Error: $@\n";
exit $exit_code;
}
exit $exit_code;
}
elsif ( $command eq "start" ) {
my $exit_code = 10;
eval {
print "Enabling the VIP - $vip on the new master - $new_master_host \n";
&start_vip();
$exit_code = 0;
};
if ($@) {
warn $@;
exit $exit_code;
}
exit $exit_code;
}
elsif ( $command eq "status" ) {
print "Checking the Status of the script.. OK \n";
exit 0;
}
else {
&usage();
exit 1;
}
}
sub start_vip() {
`ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`;
}
sub stop_vip() {
return 0 unless ($ssh_user);
`ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`;
}
sub usage {
print
"Usage: master_ip_failover --command=start|stop|stopssh|status --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n";
}
#添加執(zhí)行權限
[root@db-03 mha]# chmod +x master_ip_failover
#轉義一下配置文件中的中文字符
[root@db-03 mha]# dos2unix master_ip_failover
在主庫上綁定VIP
ifconfig eth1:1 172.16.1.55/24
問題2:如果斷電或者斷網(wǎng),binlog如何保存?
備份binlog
[root@db-03 mha]# vim app1.cnf
[binlog1]
no_master=1 #該服務不會提升為主庫
hostname=172.16.1.53 #存放binlog的服務器IP
master_binlog_dir=/data/mysql/binlog/ #binlog存放的位置點
根據(jù)manager配置文件創(chuàng)建對應的目錄
mkdir -p /data/mysql/binlog/
在存放binlog位置點執(zhí)行該命令
mysqlbinlog -R --host=172.16.1.55 --user=mha --password=mha --raw --stop-never mysql-bin.000001 &
做完停止MHA并重啟
讀寫分離Atlas
Atlas主要功能(代理)
1.讀寫分離
2.從庫負載均衡
3.IP過濾
4.自動分表
5.DBA可平滑上下線DB(不影響用戶的體驗,把你的數(shù)據(jù)庫下線)
6.自動摘除宕機的DB
Atlas相對于官方MySQL-Proxy的優(yōu)勢
1.將主流程中所有Lua代碼用C重寫踏堡,Lua僅用于管理接口
2.重寫網(wǎng)絡模型、線程模型
3.實現(xiàn)了真正意義上的連接池
4.優(yōu)化了鎖機制咒劲,性能提高數(shù)十倍
安裝配置Atlas:
1.安裝
[root@db-03 ~]# wget https://github.com/Qihoo360/Atlas/releases/download/2.2.1/Atlas-2.2.1.el6.x86_64.rpm
[root@db-03 ~]# rpm -ivh Atlas-2.2.1.el6.x86_64.rpm
編輯配置文件
[root@db-03 ~]# vim /usr/local/mysql-proxy/conf/test.cnf
[mysql-proxy]
#帶#號的為非必需的配置項目
#管理接口的用戶名
admin-username=user
#管理接口的密碼
admin-password=pwd
#Atlas后端連接的MySQL主庫的IP和端口顷蟆,可設置多項,用逗號分隔
proxy-backend-addresses=172.16.1.55:3306(用虛擬IP)
#Atlas后端連接的MySQL從庫的IP和端口腐魂,@后面的數(shù)字代表權重帐偎,用來作負載均衡,若省略則默認為1蛔屹,可設置多項削樊,用逗號分隔
proxy-read-only-backend-addresses=172.16.1.51:3306,172.16.1.53:3306
#用戶名與其對應的加密過的MySQL密碼,密碼使用PREFIX/bin目錄下的加密程序encrypt加密兔毒,下行的user1和user2為示例漫贞,將其替換為你的MySQL的用戶名和加密密碼!
pwds=rep:3yb5jEku5h4=,mha:O2jBXONX098=
--------------------------------------------------------------------------------------------------------------
###密碼必須這樣加密[root@db3 bin]# /usr/local/mysql-proxy/bin/encrypt 123
3yb5jEku5h4=
--------------------------------------------------------------------------------------------------------------
#設置Atlas的運行方式育叁,設為true時為守護進程方式迅脐,設為false時為前臺方式,一般開發(fā)調試時設為false擂红,線上運行時設為true,true后面不能有空格仪际。
daemon=true
#設置Atlas的運行方式围小,設為true時Atlas會啟動兩個進程,一個為monitor树碱,一個為worker肯适,monitor在worker意外退出后會自動將其重啟,設為false時只有worker成榜,沒有monitor框舔,一般開發(fā)調試時設為false,線上運行時設為true,true后面不能有空格赎婚。
keepalive=true
#工作線程數(shù)刘绣,對Atlas的性能有很大影響,可根據(jù)業(yè)務適當調整
event-threads=8
#日志級別挣输,分為message纬凤、warning、critical撩嚼、error停士、debug五個級別
log-level=error
#日志存放的路徑
log-path=/usr/local/mysql-proxy/log
#SQL日志的開關,可設置為OFF完丽、ON恋技、REALTIME,OFF代表不記錄SQL日志逻族,ON代表記錄SQL日志蜻底,REALTIME代表記錄SQL日志且實時寫入磁盤,默認為OFF
sql-log=ON
#慢日志輸出設置聘鳞。當設置了該參數(shù)時薄辅,則日志只輸出執(zhí)行時間超過sql-log-slow(單位:ms)的日志記錄。不設置該參數(shù)則輸出全部日志搁痛。
sql-log-slow=10
#實例名稱长搀,用于同一臺機器上多個Atlas實例間的區(qū)分
#instance = test
#Atlas監(jiān)聽的工作接口IP和端口(生產(chǎn)建議mysql端口改為別的,Atlas工作端口改為3306鸡典,前端服務直接連接3306 即可)
proxy-address=0.0.0.0:33060
#Atlas監(jiān)聽的管理接口IP和端口
admin-address=0.0.0.0:2345
#分表設置源请,此例中person為庫名,mt為表名彻况,id為分表字段谁尸,3為子表數(shù)量,可設置多項纽甘,以逗號分隔良蛮,若不分表則不需要設置該項
#tables = person.mt.id.3
#默認字符集,設置該項后客戶端不再需要執(zhí)行SET NAMES語句
charset=utf8
#允許連接Atlas的客戶端的IP悍赢,可以是精確IP决瞳,也可以是IP段货徙,以逗號分隔,若不設置該項則允許所有IP連接皮胡,否則只允許列表中的IP連接
#client-ips = 127.0.0.1, 192.168.1
#Atlas前面掛接的LVS的物理網(wǎng)卡的IP(注意不是虛IP)痴颊,若有LVS且設置了client-ips則此項必須設置,否則可以不設置
#lvs-ips = 192.168.1.1
#client-ips=
client-ips=
啟動Atlas
#啟動Atlas
[root@db-03 conf]# /usr/local/mysql-proxy/bin/mysql-proxyd study start
#檢測進程是否啟動
[root@db-03 conf]# ps -ef|grep [m]ysql-proxy
#檢查端口是否啟動
[root@db-03 conf]# netstat -lntup|grep [m]ysql-proxy
連接數(shù)據(jù)庫測試
[root@db-03 conf]# mysql -umha -pmha -h172.16.1.55 -P33060
測試讀操作:
db03 [(none)]>select @@server_id;
測試寫操作:
mysql> begin;select @@server_id;commit;
如果172.16.1.51主庫宕機屡贺,172.16.1.52變?yōu)橹鲙烊绾涡迯停?/h4>
查看幫助
select * from help
1)
1.修改配置文件
[root@db-03 ~]# vim /usr/local/mysql-proxy/conf/test.cnf
#Atlas后端連接的MySQL從庫的IP和端口蠢棱,@后面的數(shù)字代表權重,用來作負載均衡甩栈,若省略則默認為1泻仙,可設置多項,用逗號分隔
proxy-read-only-backend-addresses=172.16.1.53:3306,172.16.1.51:3306
2.重啟Atlas即可
2)
1.#進入管理接口
[root@db-03 conf]# mysql -uuser -ppwd -h127.0.0.1 -P2345
select * from backends;(先查看從庫還有誰)
remove backend 2;(看清IP地址然后移除對應的編號)
add slave 172.16.1.51:3306;(添加從庫)
save config;(保存到配置文件)
查看幫助
select * from help
1)
1.修改配置文件
[root@db-03 ~]# vim /usr/local/mysql-proxy/conf/test.cnf
#Atlas后端連接的MySQL從庫的IP和端口蠢棱,@后面的數(shù)字代表權重,用來作負載均衡甩栈,若省略則默認為1泻仙,可設置多項,用逗號分隔
proxy-read-only-backend-addresses=172.16.1.53:3306,172.16.1.51:3306
2.重啟Atlas即可
2)
1.#進入管理接口
[root@db-03 conf]# mysql -uuser -ppwd -h127.0.0.1 -P2345
select * from backends;(先查看從庫還有誰)
remove backend 2;(看清IP地址然后移除對應的編號)
add slave 172.16.1.51:3306;(添加從庫)
save config;(保存到配置文件)