由于網(wǎng)絡(luò)架構(gòu)的原因艘包,在一般虛擬機(jī)或物理環(huán)境中常見的用 VIP 來實(shí)現(xiàn)雙機(jī)高可用方案各淀,無法照搬到 Azure 平臺擎场。但利用 Azure 平臺提供的負(fù)載均衡或者內(nèi)部負(fù)載均衡功能钾腺,可以達(dá)到類似的效果。
本文介紹如何基于 Azure Load Balancer (LB), 結(jié)合 Linux 開源的產(chǎn)品 DRBD饺汹,Pacemaker 和 Corosync 實(shí)現(xiàn) MariaDB 的雙機(jī)高可用蛔添,并且搭建了一個 web 環(huán)境用戶演示 HA 的故障轉(zhuǎn)移。
Note
在實(shí)際生產(chǎn)中兜辞,用戶請根據(jù)自己的需求在此架構(gòu)上進(jìn)行擴(kuò)展改進(jìn)迎瞧。
基本架構(gòu)如下:
前提
此處使用已經(jīng)存在的一個存儲賬號存儲所有的虛擬機(jī)磁盤。
虛擬網(wǎng)絡(luò)中至少兩個子網(wǎng)逸吵,一個用于后端數(shù)據(jù)庫凶硅,一個用于前端 web。
如下圖扫皱,此處使用 lqihavnet 中 subnet-2 作為后端數(shù)據(jù)庫子網(wǎng)足绅;subnet-3 作為前端 web 子網(wǎng)捷绑。
創(chuàng)建虛擬機(jī)、可用性集和負(fù)載均衡
ASM 模式
在 Powershell 中執(zhí)行如下命令编检。
復(fù)制
add-azureaccount -e azurechinacloud
$stor="lqihastor"
$vnet="lqihavnet"
$svc="lqi1eha02"
$vmname1="lqi1ecmy01"
$vmname2="lqi1ecmy02"
$av1="mysqlav"
$av2="webav"
$vmname3="lqi1ecmy03"
$vmname4="lqi1ecmy04"
$sub1="Subnet-2"
$ip1="10.0.1.4"
$ip2="10.0.1.5"
$sub2="Subnet-3"
$ip3="10.0.2.4"
$ip4="10.0.2.5"
$loc="china east"
$imagename="f1179221e23b4dbb89e39d70e5bc9e72__OpenLogic-CentOS-72-20161027"
$vmsize="Small"
$vmuser="azureuser"
$vmpassword="P@ssw0rd01"
$datadisksize="5"
$ilb="lqilbmysql"
$epname1="MySQL"
$prot1="TCP"
$locport1="3306"
$pubport1="3306"
$ilbdist="SourceIP"
$ilbip="10.0.1.10"
$lb="lqilbweb"
$epname2="HTTP"
$prot2="TCP"
$locport2="80"
$pubport2="80"
$probeport="80"
$lbdist="SourceIP"
Set-AzureSubscription -SubscriptionId 9ef8a15c-15a2-4ef1-a19b-e31876ab177c -CurrentStorageAccountName $stor
創(chuàng)建后端數(shù)據(jù)庫虛擬機(jī):設(shè)置網(wǎng)絡(luò)胎食,靜態(tài)內(nèi)網(wǎng) IP,添加數(shù)據(jù)磁盤允懂。
復(fù)制
New-AzureVMConfig -Name "$vmname1" -InstanceSize $vmsize? -ImageName $imagename -AvailabilitySetName $av1 |
Add-AzureProvisioningConfig -Linux -LinuxUser $vmuser -Password $vmpassword |
Set-AzureSubnet -SubnetNames $sub1 |
Set-AzureStaticVNetIP -IPAddress $ip1 |
Add-AzureDataDisk -CreateNew -DiskSizeInGB $datadisksize -DiskLabel "DataDisk" -LUN 0 |
New-AzureVM -ServiceName $svc -vNetName $vnet? -Location $loc
New-AzureVMConfig -Name "$vmname2" -InstanceSize $vmsize? -ImageName $imagename -AvailabilitySetName $av1 |
Add-AzureProvisioningConfig -Linux -LinuxUser $vmuser -Password $vmpassword |
Set-AzureSubnet -SubnetNames $sub1 |
Set-AzureStaticVNetIP -IPAddress $ip2 |
Add-AzureDataDisk -CreateNew -DiskSizeInGB $datadisksize -DiskLabel "DataDisk" -LUN 0 |
New-AzureVM -ServiceName $svc -vNetName $vnet? -Location $loc
創(chuàng)建內(nèi)部負(fù)載均衡厕怜,并將虛擬機(jī)加入負(fù)載均衡。
復(fù)制
Add-AzureInternalLoadBalancer -ServiceName $svc -InternalLoadBalancerName $ilb –SubnetName $sub1 –StaticVNetIPAddress $ilbip
Get-AzureVM –ServiceName $svc –Name $vmname1 | Add-AzureEndpoint -Name $epname1 -Protocol $prot1 -LocalPort $locport1 -PublicPort $pubport1 -LoadBalancerDistribution $ilbdist –DefaultProbe -InternalLoadBalancerName $ilb | update-AzureVM
Get-AzureVM –ServiceName $svc –Name $vmname2 | Add-AzureEndpoint -Name $epname1 -Protocol $prot1 -LocalPort $locport1 -PublicPort $pubport1 -LoadBalancerDistribution $ilbdist –DefaultProbe -InternalLoadBalancerName $ilb | update-AzureVM
創(chuàng)建前端 web 虛擬機(jī):設(shè)置網(wǎng)絡(luò)蕾总,靜態(tài)內(nèi)網(wǎng) IP粥航,加入可用性集,配置負(fù)載均衡生百。
復(fù)制
New-AzureVMConfig -Name "$vmname3" -InstanceSize $vmsize? -ImageName $imagename -AvailabilitySetName $av2 |
Add-AzureProvisioningConfig -Linux -LinuxUser $vmuser -Password $vmpassword |
Set-AzureSubnet -SubnetNames $sub2 |
Set-AzureStaticVNetIP -IPAddress $ip3 |
Add-AzureEndpoint -Name $epname2 -Protocol $prot2 -PublicPort $pubport2 -LocalPort $locport2 -LBSetName $lb -ProbePort $probeport -ProbeProtocol $prot2 -ProbeIntervalInSeconds 10 |
New-AzureVM -ServiceName $svc -vNetName $vnet? -Location $loc
New-AzureVMConfig -Name "$vmname4" -InstanceSize $vmsize? -ImageName $imagename -AvailabilitySetName $av2 |
Add-AzureProvisioningConfig -Linux -LinuxUser $vmuser -Password $vmpassword |
Set-AzureSubnet -SubnetNames $sub2 |
Set-AzureStaticVNetIP -IPAddress $ip4 |
Add-AzureEndpoint -Name $epname2 -Protocol $prot2 -PublicPort $pubport2 -LocalPort $locport2 -LBSetName $lb -ProbePort $probeport -ProbeProtocol $prot2 -ProbeIntervalInSeconds 10 |
New-AzureVM -ServiceName $svc -vNetName $vnet? -Location $loc
ARM 模式
從該 GitHub Repo :Azure-Customized-Resources中部署递雀。
配置后端數(shù)據(jù)庫 HA
后端數(shù)據(jù)庫使用 DRBD + Pacemake + Corosync 實(shí)現(xiàn) MariaDB 主備集群。
其中蚀浆,DRBD 實(shí)現(xiàn)數(shù)據(jù)的復(fù)制缀程。管理工具 drbdadm。更多參考點(diǎn)擊drbd 介紹市俊、工作原理及腦裂故障處理杨凑。
Corosync 是集群引擎,管理消息和成員摆昧。Pacemaker 是集群資源管理器撩满,管理工具 pcs。
CentOS 7 中绅你,將原來的管理工具進(jìn)行了改進(jìn)集成伺帘,現(xiàn)在僅需要使用 pcs 即可管理引擎和資源,進(jìn)行配置同步忌锯。
如果您使用 CentOS 6伪嫁,配置流程一樣,但配置使用的命令參數(shù)需要調(diào)整汉规。
CentOS 7 開始礼殊,由于 license 問題,mysql 數(shù)據(jù)庫改成了開源的 MariaDB针史。
CentOS 7默認(rèn)開啟了 SeLinux 增強(qiáng)安全功能,為方便 demo碟狞,這里關(guān)閉該功能啄枕,生產(chǎn)環(huán)境中如果需要開啟,在配置 DRDB 等時需要額外配置一些 SeLinux 規(guī)則族沃,這里省略介紹频祝。
配置前準(zhǔn)備工作
在兩個節(jié)點(diǎn)上分別執(zhí)行如下命令:
在兩節(jié)點(diǎn)上編輯/etc/selinux/config泌参,將SELINUX改為disabled,保存文件常空,重啟服務(wù)器沽一。
用全盤做一個主分區(qū)/dev/sdc, 不需要格式化成任何文件系統(tǒng),該分區(qū)將由 DRBD 接管漓糙,文件系統(tǒng)將建立在 DRBD 設(shè)備上铣缠。
復(fù)制
# fdisk /dev/sdc
配置 yum 倉庫以及后續(xù)需要使用的安裝包。
復(fù)制
# wget http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm
# rpm -ivh elrepo-release-7.0-2.el7.elrepo.noarch.rpm
# rpm --import /etc/pki/rpm-gpg/RPM-GPG-KEY-elrepo.org
# yum repolist
配置DRBD
在兩個節(jié)點(diǎn)上分別執(zhí)行如下命令昆禽。
安裝 DRBD 模塊蝗蛙,安裝完成后,重啟服務(wù)器醉鳖。
復(fù)制
# yum install kmod-drbd84 drbd84-utils
加載 DRBD 內(nèi)核模塊捡硅,使用 lsmod 查看是否加載成功。
復(fù)制
# modprobe drbd
# lsmod | grep drbd
在兩個節(jié)點(diǎn)上盗棵,新建一個DRBD 資源壮韭。
命令中的mysqlr0,lqi1ecmy01,10.0.1.4,lqilecmy02,10.0.1.5部分根據(jù)自己的環(huán)境替換。
復(fù)制
# vi /etc/drbd.d/mysqlr0.res
resource mysqlr0 {
protocol C;
on lqi1ecmy01 {
device /dev/drbd1;
disk /dev/sdc;
address 10.0.1.4:7788;
meta-disk internal;
}
on lqi1ecmy02 {
device /dev/drbd1;
disk /dev/sdc;
address 10.0.1.5:7788;
meta-disk internal;
}
}
初始化 DRBD 資源纹因,在兩個節(jié)點(diǎn)上分別執(zhí)行:
復(fù)制
# drbdadm create-md mysqlr0
啟動 DRBD 服務(wù)喷屋,一個節(jié)點(diǎn)上執(zhí)行 start 命令后,立刻在另一個節(jié)點(diǎn)同步執(zhí)行辐怕,兩條命令執(zhí)行完畢逼蒙,DRDB 服務(wù)將成功啟動。使用 status 命令查看服務(wù)狀態(tài)寄疏,使用 enable 命令設(shè)置開機(jī)自啟動是牢。
復(fù)制
# systemctl start drbd
# systemctl status drbd
# systemctl enable drbd
選擇其中一個節(jié)點(diǎn)執(zhí)行下面命令。命令執(zhí)行成功陕截,該節(jié)點(diǎn)將成為 DRBD 主節(jié)點(diǎn)驳棱,另一節(jié)點(diǎn)成為備用節(jié)點(diǎn),并開始第一次狀態(tài)和數(shù)據(jù)同步农曲。
復(fù)制
# drbdadm primary mysqlr0 --force
使用下面命令查看同步狀態(tài)社搅,你可能看到 DRBD 處于 sync 狀態(tài)。等待 sync 成功乳规,兩節(jié)點(diǎn)都變成 UptoDate 狀態(tài)形葬,再進(jìn)行下一步操作。
復(fù)制
# cat /proc/drbd
或者
復(fù)制
# drbd-overview
在創(chuàng)建的 DRBD 資源上創(chuàng)建文件系統(tǒng)并掛載暮的。在主節(jié)點(diǎn)上執(zhí)行:
復(fù)制
# mkfs.ext3 /dev/drbd1
# mkdir /var/lib/mysql
# mount /dev/drbd1 /var/lib/mysql/
DRBD 配置完成笙以,接下來安裝 MariaDB 服務(wù)器。
安裝 MariaDB 數(shù)據(jù)庫
在主節(jié)點(diǎn)上執(zhí)行如下命令冻辩,并初始化 mysql 安裝選項(xiàng)猖腕。
復(fù)制
# yum -y install mariadb-server mariadb
# service mariadb start
# /usr/bin/mysql_secure_installation
接著在備用節(jié)點(diǎn)上安裝數(shù)據(jù)庫拆祈。首先停止主節(jié)點(diǎn)上相關(guān)服務(wù):
復(fù)制
# systemctl stop mariadb.service
# umount /var/lib/mysql/
# drbdadm secondary mysqlr0
在另一節(jié)點(diǎn)上:
復(fù)制
# drbdadm primary mysqlr0
# mount /dev/drbd1 /var/lib/mysql
# yum install mariadb-server
# service mariadb start
然后在該節(jié)點(diǎn)上登錄數(shù)據(jù)庫,創(chuàng)建 web 應(yīng)用需要的數(shù)據(jù)庫和用戶倘感。
復(fù)制
# mysql -u root -p
MariaDB [(none)]> create database wordpress;
Query OK, 1 row affected (0.04 sec)
MariaDB [(none)]> create user 'wpuser'@'%' identified by 'wppassword';
Query OK, 0 rows affected (0.00 sec)
MariaDB [(none)]> grant all privileges on wordpress.* to 'wpuser'@'%';
Query OK, 0 rows affected (0.00 sec)
MariaDB [(none)]> flush privileges;
Query OK, 0 rows affected (0.00 sec)
MariaDB [(none)]> exit
Bye
配置 Pacemaker + Corosync
在兩個節(jié)點(diǎn)上分別執(zhí)行如下命令放坏。
復(fù)制
# yum install corosync pacemaker pcs
# systemctl start pcsd.service
# systemctl enable pcsd.service
為集群用戶設(shè)置密碼,該用戶將用來在集群節(jié)點(diǎn)間通信老玛,進(jìn)行數(shù)據(jù)同步淤年。
復(fù)制
# passwd hacluster
該步驟僅需要在某一節(jié)點(diǎn)上執(zhí)行。
復(fù)制
# pcs cluster auth lqi1ecmy01 lqi1ecmy02
創(chuàng)建集群逻炊,啟動集群互亮,查看集群狀態(tài)。
復(fù)制
# pcs cluster setup --name mysqlcluster lqi1ecmy01 lqi1ecmy02
# pcs cluster start –all
# pcs status
因?yàn)樘摂M機(jī)沒有真正的 fence 設(shè)備余素,所以需要禁用 fence 功能豹休。
復(fù)制
# pcs property set stonith-enabled=false
因?yàn)閮晒?jié)點(diǎn)集群不需要在 vote 功能,所以禁用 quorum桨吊。
復(fù)制
# pcs property set no-quorum-policy=ignore
添加集群資源威根,將 DRBD,文件系統(tǒng)和MariaDB服務(wù)納入集群管理视乐,并設(shè)置彼此之間的依賴關(guān)系洛搀。
復(fù)制
# pcs -f drbd_cfg resource create drbd_ha ocf:linbit:drbd drbd_resource=mysqlr0 op monitor interval=60s
# pcs -f drbd_cfg resource master? ms_drbd_ha drbd_ha master-max=1 master-node-max=1 clone-max=2 clone-node-max=1 notify=true
# pcs -f drbd_cfg resource create drbd_fs Filesystem device="/dev/drbd1" directory="/var/lib/mysql" fstype="ext3"
# pcs -f drbd_cfg resource constraint colocation add drbd_fs with ms_drbd_ha INFINITY with-rsc-role=Master
# pcs -f drbd_cfg constraint colocation add drbd_fs with ms_drbd_ha INFINITY with-rsc-role=Master
# pcs -f drbd_cfg constraint order promote ms_drbd_ha then start drbd_fs
# pcs -f drbd_cfg resource create mysql_svc ocf:heartbeat:mysql binary="/usr/bin/mysqld_safe" config="/etc/my.cnf" datadir="/var/lib/mysql" pid="/var/run/mariadb/mariadb.pid" socket="/var/lib/mysql/mysql.sock"? additional_parameters="--bind-address=0.0.0.0" op start timeout=60s op stop timeout=60s op monitor interval=20s timeout=30s
# pcs -f drbd_cfg constraint colocation add mysql_svc with drbd_fs INFINITY
# pcs -f drbd_cfg constraint order drbd_fs then mysql_svc
# pcs cluster cib-push drbd_cfg
配置好之后,查看集群運(yùn)行狀態(tài)佑淀。正常狀態(tài)如下留美,若有異常,請根據(jù)錯誤信息進(jìn)行故障排除伸刃。日志文件在/var/log/下谎砾。
復(fù)制
# pcs status
在兩邊節(jié)點(diǎn)上,執(zhí)行下面命令設(shè)置 Corosync捧颅,Pacemaker 開機(jī)自啟動景图。MariaDB 不需要設(shè)置,集群會根據(jù) DRBD 主備關(guān)系自動判斷在哪個節(jié)點(diǎn)啟動該服務(wù)碉哑。
復(fù)制
# systemctl enable corosync pacemaker
配置前端 web LB
同樣挚币,我們需要在系統(tǒng)中禁用 Selinux,步驟參考前面配置 MariaDB 部分扣典。在實(shí)際生產(chǎn)環(huán)境中妆毕,建議開啟,因?yàn)?web 服務(wù)器和端口是曝露在公網(wǎng)環(huán)境中的贮尖。
此處通過安裝 Nginx + Wordpress 來演示負(fù)載均衡设塔。下面步驟需要在兩個節(jié)點(diǎn)上分別執(zhí)行。
安裝 nginx, PHP, mariaDB 客戶端远舅。
首先配置 yum 倉庫闰蛔。
復(fù)制
# vi /etc/yum.repos.d/nginx.repo
[nginx]
name=nginx repo
baseurl=http://nginx.org/packages/mainline/rhel/7/$basearch/
gpgcheck=0
enabled=1
# yum install mariadb nginx php php-fpm php-mysql
配置 nginx,同樣根據(jù)自己的環(huán)境替換lqi1eha02,wordpress,wpuser,wppassword,10.0.1.10部分內(nèi)容图柏。
復(fù)制
# vi /etc/nginx/conf.d/default.conf
server {
listen 80;
server_name lqi1eha02.chinacloudapp.cn;
access_log /usr/share/nginx/lqi1eha02.chinacloudapp.cn/logs/access.log;
error_log /usr/share/nginx/lqi1eha02.chinacloudapp.cn/logs/error.log;
location / {
root /usr/share/nginx/lqi1eha02.chinacloudapp.cn;
index index.php index.html index.htm;
if (-f $request_filename) {
expires 30d;
break;
}
if (!-e $request_filename) {
rewrite ^(.+)$ /index.php?q=$1 last;
}
}
location ~ .php$ {
fastcgi_pass? localhost:9000;? # port where FastCGI processes were spawned
fastcgi_index? index.php;
fastcgi_param? SCRIPT_FILENAME? /usr/share/nginx/lqi1eha02.chinacloudapp.cn$fastcgi_script_name;? # same path as above
fastcgi_param PATH_INFO? ? ? ? ? ? ? $fastcgi_script_name;
include /etc/nginx/fastcgi_params;
}
}
# vi /etc/php.ini
cgi.fix_pathinfo=0
# mkdir /usr/share/nginx/lqi1eha02.chinacloudapp.cn/
# mkdir /usr/share/nginx/lqi1eha02.chinacloudapp.cn/logs
安裝 wordpress序六。配置數(shù)據(jù)庫連接信息。兩節(jié)點(diǎn)上分別執(zhí)行蚤吹。
復(fù)制
# wget http://wordpress.org/latest.tar.gz
# tar zxvf wordpress-4.6.1.tar.gz
# mv wordpress/* /usr/share/nginx/lqi1eha02.chinacloudapp.cn/
# cp /usr/share/nginx/lqi1eha02.chinacloudapp.cn/wp-config-sample.php /usr/share/nginx/lqi1eha02.chinacloudapp.cn/wp-config.php
# vi wp-config.php
// ** MySQL settings - You can get this info from your web host ** //
/** The name of the database for WordPress */
define('DB_NAME', 'wordpress');
/** MySQL database username */
define('DB_USER', 'wpuser');
/** MySQL database password */
define('DB_PASSWORD', 'wppassword');
/** MySQL hostname */
define('DB_HOST', '10.0.1.10');
# chown +R nginx:nginx /usr/share/nginx/lqi1eha02.chinacloudapp.cn/
# chmod +R 777 /usr/share/nginx/lqi1eha02.chinacloudapp.cn/
重啟服務(wù)例诀,使配置生效,并設(shè)置開機(jī)自啟動裁着。
復(fù)制
# systemctl restart nginx php-fpm
# systemctl enable nginx php-fpm
通過瀏覽器訪問 web 域名繁涂,初始化 wordpress。
這樣二驰,一個簡單的 web 環(huán)境就設(shè)置好了扔罪。下面進(jìn)行測試。
故障轉(zhuǎn)移測試
我們模擬每個節(jié)點(diǎn)宕機(jī)的情況下桶雀,看能否正常使用 wordpress矿酵。順序分別為:
mysql slave 宕機(jī)
master 宕機(jī)
nginx 中任何一個宕機(jī)
在每個節(jié)點(diǎn)宕機(jī)后,更新一篇帖子矗积,再將服務(wù)集群恢復(fù)全肮,看是否能正確更新到數(shù)據(jù)庫,并顯示出來棘捣。
數(shù)據(jù)庫備用節(jié)點(diǎn)宕機(jī)
備用節(jié)點(diǎn)宕機(jī)完全不影響服務(wù)正常使用辜腺,但重新啟用備用節(jié)點(diǎn)后,要注意觀察集群服務(wù)是否恢復(fù)正常乍恐,如 pcs status, /proc/drbd评疗。
下圖顯示備用節(jié)點(diǎn)宕機(jī)。我們更新一篇帖子:This is my second blog…(詳細(xì)看最后 wordpress 截圖)
啟動備用節(jié)點(diǎn)后禁熏,注意觀察節(jié)點(diǎn)狀態(tài)壤巷。
主節(jié)點(diǎn)宕機(jī)
如下圖所示,服務(wù)自動切換到備用節(jié)點(diǎn)瞧毙。我們更新一篇帖子:this is my third blog…
重新啟動故障節(jié)點(diǎn)胧华,注意觀察集群狀態(tài)和 DRBD 同步狀態(tài)。
任一前端 web 宕機(jī)
前端 web 采用了負(fù)載均衡宙彪,因此不論那一臺宕機(jī)矩动,服務(wù)會自動全部轉(zhuǎn)移到另一節(jié)點(diǎn)。我們分別在每一條宕機(jī)后更新一篇帖子:This is my fourth/fifth blog….
最后释漆,當(dāng)所有節(jié)點(diǎn)全部啟動悲没,我們來看看是否所有帖子都能顯示,如下圖男图。