在 MySQL 主從復(fù)制時(shí),有時(shí)候會(huì)碰到這樣的故障:在 Slave 上 Slave_IO_Running 和 Slave_SQL_Running 都是 Yes,Slave_SQL_Running_State 顯示 Slave has read all relay log; waiting for the slave I/O thread to update it 家乘,看起來狀態(tài)都正常蝗羊,但實(shí)際卻滯后于主,Master_Log_File 和 Read_Master_Log_Pos 也不是實(shí)際主上最新的位置仁锯。一種可能是 Master 上的 binlog dump 線程掛了耀找。但有時(shí)候,在 Master 上檢查也是完全正常的扑馁。那 Slave 的延誤又是怎么造成的呢涯呻?
在 MySQL 的復(fù)制協(xié)議里,由 Slave 發(fā)送一個(gè) COM_BINLOG_DUMP 命令后腻要,就完全由 Master 來推送數(shù)據(jù)复罐,Master、Slave 之間不再需要交互雄家。如果 Master 沒有更新效诅,也就不會(huì)有數(shù)據(jù)流,Slave 就不會(huì)收到任何數(shù)據(jù)包趟济。但是如果由于某種原因造成 Master 無法把數(shù)據(jù)發(fā)送到 Slave 乱投,比如發(fā)生過網(wǎng)絡(luò)故障或其他原因?qū)е?Master 上的 TCP 連接丟失,由于 TCP 協(xié)議的特性顷编,Slave 沒有機(jī)會(huì)得到通知戚炫,所以也沒法知道收不到數(shù)據(jù)是因?yàn)?Master 本來就沒有更新呢還是由于出了故障。
好在 MySQL 5.5 開始增加了一個(gè)復(fù)制心跳的功能媳纬。
如
代碼如下:
stop slave;
change master to master_heartbeat_period = 10;
set global slave_net_timeout = 25;
start slave;
就會(huì)讓 Master 在沒有數(shù)據(jù)的時(shí)候双肤,每 10 秒發(fā)送一個(gè)心跳包。這樣 Slave 就能知道 Master 是不是還正常钮惠。slave_net_timeout 是設(shè)置在多久沒收到數(shù)據(jù)后認(rèn)為網(wǎng)絡(luò)超時(shí)茅糜,之后 Slave 的 IO 線程會(huì)重新連接 Master 。結(jié)合這兩個(gè)設(shè)置就可以避免由于網(wǎng)絡(luò)問題導(dǎo)致的復(fù)制延誤素挽。master_heartbeat_period 單位是秒蔑赘,可以是個(gè)帶上小數(shù),如 10.5预明。最高精度為 1 毫秒缩赛。
slave_net_timeout 的默認(rèn)是 3600,也就是一小時(shí)撰糠。也就是說峦筒,在之前的情況下,Slave 要延誤 1 小時(shí)后才會(huì)嘗試重連窗慎。而在沒有設(shè)置 master_heartbeat_period 時(shí),將 slave_net_timeout 設(shè)得很短會(huì)造成 Master 沒有數(shù)據(jù)更新時(shí)頻繁重連。
很奇怪的是遮斥,當(dāng)前的 master_heartbeat_period 值無法通過 show slave status 查看峦失,而要使用 show status like ‘Slave_heartbeat_period' 查看。此外术吗,狀態(tài)變量 Slave_last_heartbeat 表示最后一次收到心跳的時(shí)間尉辑,Slave_received_heartbeats 表示總共收到的心跳次數(shù)。
如:
代碼如下:
mysql> show status like 'slave%';
+----------------------------+---------------------+
| Variable_name | Value |
+----------------------------+---------------------+
| Slave_heartbeat_period | 5.000 |
| Slave_last_heartbeat | 2014-05-08 11:48:57 |
| Slave_open_temp_tables | 0 |
| Slave_received_heartbeats | 1645 |
| Slave_retried_transactions | 0 |
| Slave_running | ON |
+----------------------------+---------------------+
6 rows in set (0.00 sec)