設(shè)置Proxmox VE集群使用Ceph共享存儲

一個人的生命中遲早會有這樣一個時刻——你必須開始考慮你的服務(wù)的彈性和高可用性染突。本文討論如何在具有共享存儲的3個節(jié)點(diǎn)上配置Proxmox HA集群兼雄,為VM的動態(tài)遷移提供可能梧税。我們考慮了很多關(guān)于選擇什么作為共享存儲的問題(選擇在ceph和gluster之間)部默,最后決定詳細(xì)討論ceph侵蒙。在這里這里,您可以找到關(guān)于這兩個存儲的優(yōu)點(diǎn)和缺點(diǎn)傅蹂,所以您可以自由地選擇您的案例中需要的這個纷闺。


創(chuàng)建集群

我們的設(shè)置中使用的IP地址和DNS名稱列表

192.168.25.61 machine1
192.168.25.62 machine2
192.168.25.63 machine3

首先,我們需要設(shè)置3個proxmox節(jié)點(diǎn)份蝴。為此我們可以從官方網(wǎng)站使用proxmox iso 或者從新的debian上的存儲庫安裝它犁功。

從repo安裝我建議使用官方指南

安裝完成后婚夫,您需要更新系統(tǒng)

sudo apt-get update

之后浸卦,我們將在每個節(jié)點(diǎn)上編輯/etc/hosts以獲得更多便利

127.0.0.1 localhost.localdomain localhost
192.168.25.61 machine1.local machine1 pvelocalhost
192.168.25.62 machine2.local machine2
192.168.25.63 machine3.local machine3

通過ping檢查每個節(jié)點(diǎn)是否看到對方。

為Proxmox添加repo

echo "deb [http://download.proxmox.com/debian/pve](http://download.proxmox.com/debian/pve?source=post_page---------------------------) stretch pve-no-subscription" > /etc/apt/sources.list


現(xiàn)在我們準(zhǔn)備創(chuàng)建一個集群案糙。在將充當(dāng)主節(jié)點(diǎn)的節(jié)點(diǎn)上限嫌,輸入命??令

pvecm create <clustername>

將剩余節(jié)點(diǎn)添加到群集

pvecm add "masternode ip or dns name"

檢查所有節(jié)點(diǎn)是否在群集中

pvecm status

如果一切順利靴庆,我們可以訪問web-gui并能夠從一個瀏覽器窗口管理所有節(jié)點(diǎn)。無論您登錄哪個節(jié)點(diǎn)萤皂,這都有效撒穷。(8006是Proxmox web-gui的默認(rèn)端口)


配置Ceph

讓我們配置Сeph存儲,為此我建議使用分離的網(wǎng)絡(luò)用于VM和專用網(wǎng)絡(luò)用于Ceph(如果你想使用SSD裆熙,10gb網(wǎng)卡會很好看端礼,特別是

對于節(jié)點(diǎn)之間的VM實(shí)時遷移,您可能需要創(chuàng)建vlan入录,以便VM可以看到彼此蛤奥,即使它們位于不同的節(jié)點(diǎn)上。

確保在防火墻中允許端口6789,6800-7100僚稿。Ceph監(jiān)視器默認(rèn)偵聽端口6789凡桥。守護(hù)進(jìn)程也綁定到6800-7100范圍內(nèi)的端口。

在所有節(jié)點(diǎn)上安裝Ceph:

pveceph install --version luminous

僅在masternode上初始化Ceph(將10.10.10.0/24更改為您的CIDR塊):

pveceph init --network 10.10.10.0/24

在節(jié)點(diǎn)上創(chuàng)建監(jiān)視器蚀同,為每個重復(fù)此操作:

pveceph createmon

現(xiàn)在創(chuàng)建Ceph監(jiān)視器之后缅刽,我們可以使用GUI來完成剩余的進(jìn)程。

通過web-ui創(chuàng)建OSD蠢络。在群集中的每個節(jié)點(diǎn)上執(zhí)行此操作衰猛。

順便說一句,就是這樣刹孔,你可以使用web-gui創(chuàng)建Ceph存儲池啡省,你會很好,buuuut ......


默認(rèn)情況下髓霞,在創(chuàng)建存儲池時卦睹,它會嘗試分配所有已發(fā)現(xiàn)的OSD。通常方库,Ceph集群通常由具有多個磁盤驅(qū)動器的多個節(jié)點(diǎn)組成结序。并且,這些磁盤驅(qū)動器可以是混合類型纵潦。我們將創(chuàng)建一個名為ssd-pool的池笼痹,由SSD磁盤支持,另一個池名為sata-pool酪穿,由SATA磁盤支持。

在這種情況下晴裹,osd.0被济,osd.1和osd.2是SSD磁盤。類似地涧团,osd.3只磷,osd.4经磅,osd.5,osd.6钮追,osd.7和osd.8是SATA磁盤预厌。

  1. 獲取當(dāng)前的CRUSH映射并對其進(jìn)行反編譯:
ceph osd getcrushmap -o crushmapdump
crushtool -d crushmapdump -o crushmapdump-decompiled

2.編輯crushmapdump-decompiled CRUSH映射文件??,并在根默認(rèn)部分后添加以下部分:

root ssd {
 id -20
 alg straw
 hash 0
 item osd.0 weight 0.010
 item osd.1 weight 0.010
 item osd.2 weight 0.010
}
root sata {
 id -21
 alg straw
 hash 0
 item osd.3 weight 0.010
 item osd.4 weight 0.010
 item osd.5 weight 0.010
 item osd.6 weight 0.010
 item osd.7 weight 0.010
 item osd.8 weight 0.010
}

3.通過在CRUSH映射的rules部分下添加以下規(guī)則來創(chuàng)建CRUSH規(guī)則元媚,然后保存并退出該文件:

rule ssd-pool {
 ruleset 1
 type replicated
 min_size 2
 max_size 10
 step take ssd
 step chooseleaf firstn 0 type osd
 step emit
}
rule sata-pool {
 ruleset 2
 type replicated
 min_size 2
 max_size 10
 step take sata
 step chooseleaf firstn 0 type osd
 step emit
}

4.在Ceph集群中編譯并注入新的CRUSH映射:

crushtool -c crushmapdump-decompiled -o crushmapdump-compiled
ceph osd setcrushmap -i crushmapdump-compiled

5.檢查OSD樹視圖以了解新安排轧叽,并注意ssd和sata根桶:

ceph osd tree

6.創(chuàng)建并驗(yàn)證ssd-pool

ceph osd pool create ssd-pool 128

128 - pg_num的數(shù)量刊棕,您可以使用計算器來計算Ceph所需的放置組數(shù)量炭晒。

驗(yàn)證ssd-pool,注意crush_ruleset是0甥角,默認(rèn)情況下:

ceph osd dump | grep -i ssd

讓我們更改crush_ruleset网严,以便在SSD磁盤上創(chuàng)建新池:

ceph osd pool set ssd-pool crush_rule ssd-pool

驗(yàn)證池并注意crush_ruleset中的更改:

ceph osd dump | grep -i ssd

7.同樣,創(chuàng)建并驗(yàn)證sata-pool嗤无。

ceph osd pool create sata-pool 128
ceph osd dump | grep -i sata
ceph osd pool create sata-pool 128
ceph osd pool set sata-pool crush_rule sata-pool
ceph osd dump | grep -i sata

8.讓我們檢查它是否像預(yù)期的那樣工作震束。

由于這些池是新的,它們不應(yīng)包含任何對象当犯,但讓我們使用rados list命令驗(yàn)證這一點(diǎn):

rados -p ssd-pool ls
rados -p sata-pool ls

現(xiàn)在我們使用rados put命令向這些池添加一個對象垢村。語法應(yīng)該是:

rados -p <pool_name> put <object_name> <file_name>

rados -p ssd-pool put dummy_object1 /etc/hosts
rados -p sata-pool put dummy_object1 /etc/hosts

使用rados list命令列出這些池。你應(yīng)該得到我們在最后一步中存儲的對象名稱:

rados -p ssd-pool ls
rados -p sata-pool ls

9.驗(yàn)證對象是否存儲在正確的OSD集上灶壶。使用以下語法檢查osd映射中的ssd-pool

ceph osd map <pool_name> <object_name>

ceph osd map ssd-pool dummy_object1

您應(yīng)該獲得具有OSD的id的輸出肝断,其中實(shí)際存儲“dummy_object1”。如前面的屏幕截圖所示驰凛,在ssd-pool上創(chuàng)建的對象實(shí)際上存儲在OSD集[0,2,1]中胸懈。此輸出是預(yù)期的,它驗(yàn)證我們創(chuàng)建的池使用我們請求的正確OSD集恰响。


要指出結(jié)論趣钱,可以說目前是一個完整的解決方案,可以毫不費(fèi)力地大大提高虛擬化平臺的容錯能力胚宦。另一方面首有,Ceph提供卓越的可靠性和可擴(kuò)展性,使我們能夠通過熱添加OSD來增加存儲容量枢劝。

如果您發(fā)現(xiàn)這些擴(kuò)展中的任何一個很有用并且您喜歡這篇文章井联,請隨意點(diǎn)擊并按住拍手按鈕!:)

轉(zhuǎn):https://medium.com/@qwonkiwow/setting-up-a-proxmox-ve-cluster-with-ceph-shared-storage-e7a4f652f321

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末您旁,一起剝皮案震驚了整個濱河市烙常,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌鹤盒,老刑警劉巖蚕脏,帶你破解...
    沈念sama閱讀 221,430評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件侦副,死亡現(xiàn)場離奇詭異,居然都是意外死亡驼鞭,警方通過查閱死者的電腦和手機(jī)秦驯,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,406評論 3 398
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來挣棕,“玉大人译隘,你說我怎么就攤上這事⊙ㄕ牛” “怎么了细燎?”我有些...
    開封第一講書人閱讀 167,834評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長皂甘。 經(jīng)常有香客問我玻驻,道長,這世上最難降的妖魔是什么偿枕? 我笑而不...
    開封第一講書人閱讀 59,543評論 1 296
  • 正文 為了忘掉前任璧瞬,我火速辦了婚禮,結(jié)果婚禮上渐夸,老公的妹妹穿的比我還像新娘嗤锉。我一直安慰自己,他們只是感情好墓塌,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,547評論 6 397
  • 文/花漫 我一把揭開白布瘟忱。 她就那樣靜靜地躺著勾习,像睡著了一般充岛。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上锋拖,一...
    開封第一講書人閱讀 52,196評論 1 308
  • 那天韩肝,我揣著相機(jī)與錄音触菜,去河邊找鬼。 笑死哀峻,一個胖子當(dāng)著我的面吹牛涡相,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播剩蟀,決...
    沈念sama閱讀 40,776評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼催蝗,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了育特?” 一聲冷哼從身側(cè)響起生逸,我...
    開封第一講書人閱讀 39,671評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后槽袄,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,221評論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡锋谐,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,303評論 3 340
  • 正文 我和宋清朗相戀三年遍尺,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片涮拗。...
    茶點(diǎn)故事閱讀 40,444評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡乾戏,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出三热,到底是詐尸還是另有隱情鼓择,我是刑警寧澤,帶...
    沈念sama閱讀 36,134評論 5 350
  • 正文 年R本政府宣布就漾,位于F島的核電站呐能,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏抑堡。R本人自食惡果不足惜摆出,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,810評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望首妖。 院中可真熱鬧偎漫,春花似錦、人聲如沸有缆。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,285評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽棚壁。三九已至杯矩,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間灌曙,已是汗流浹背菊碟。 一陣腳步聲響...
    開封第一講書人閱讀 33,399評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留在刺,地道東北人逆害。 一個月前我還...
    沈念sama閱讀 48,837評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像蚣驼,于是被迫代替她去往敵國和親魄幕。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,455評論 2 359

推薦閱讀更多精彩內(nèi)容