【HDFS篇11】HA高可用

先達到極限眯勾,然后再突破它

HA高可用

HA概述

  1. 所謂HA(High Available)即彪,即高可用(7*24小時不中斷服務)。

  2. 實現(xiàn)高可用最關鍵的策略是消除單點故障兼丰。HA嚴格來說應該分成各個組件的HA機制:HDFS的HA和YARN的HA肘交。

  3. Hadoop2.0之前笆载,在HDFS集群中NameNode存在單點故障(SPOF)。

  4. NameNode主要在以下兩個方面影響HDFS集群

    NameNode機器發(fā)生意外涯呻,如宕機凉驻,集群將無法使用,直到管理員重啟

    NameNode機器需要升級复罐,包括軟件涝登、硬件升級,此時集群也將無法使用

    HDFS HA功能通過配置Active/Standby兩個NameNodes實現(xiàn)在集群中對NameNode的熱備來解決上述問題效诅。如果出現(xiàn)故障胀滚,如機器崩潰或機器需要升級維護,這時可通過此種方式將NameNode很快的切換到另外一臺機器乱投。

HDFS-HA工作要點

1.元數(shù)據(jù)管理方式需要改變

內(nèi)存中各自保存一份元數(shù)據(jù)蛛淋;Edits日志只有Active狀態(tài)的NameNode節(jié)點可以做寫操作;兩個NameNode都可以讀取Edits篡腌;共享的Edits放在一個共享存儲中管理(qjournal和NFS兩個主流實現(xiàn));

2.需要一個狀態(tài)管理功能模塊

實現(xiàn)了一個zkfailover勾效,常駐在每一個namenode所在的節(jié)點嘹悼,每一個zkfailover負責監(jiān)控自己所在NameNode節(jié)點,利用zk進行狀態(tài)標識层宫,當需要進行狀態(tài)切換時杨伙,由zkfailover來負責切換,切換時需要防止brain split現(xiàn)象的發(fā)生萌腿。

3.必須保證兩個NameNode之間能夠ssh無密碼登錄

4.隔離(Fence)限匣,即同一時刻僅僅有一個NameNode對外提供服務

HDFS-HA自動故障轉移工作機制

手動轉移命令

hdfs haadmin -failover

但是手動轉移不夠方便,我們需要配置自動故障轉移毁菱,自動故障轉移為HDFS部署增加了兩個新組件ZooKeeper和ZKFailoverController(ZKFC)進程

HA的自動故障轉移依賴于ZooKeeper的以下功能:

  • 故障檢測:集群中的每個NameNode在ZooKeeper中維護了一個持久會話米死,如果機器崩潰锌历,ZooKeeper中的會話將終止,ZooKeeper通知另一個NameNode需要觸發(fā)故障轉移峦筒。

  • 現(xiàn)役NameNode選擇:ZooKeeper提供了一個簡單的機制用于唯一的選擇一個節(jié)點為active狀態(tài)究西。如果目前現(xiàn)役NameNode崩潰,另一個節(jié)點可能從ZooKeeper獲得特殊的排外鎖以表明它應該成為現(xiàn)役NameNode物喷。

    ZKFC是自動故障轉移中的另一個新組件卤材,是ZooKeeper的客戶端,也監(jiān)視和管理NameNode的狀態(tài)峦失。每個運行NameNode的主機也運行了一個ZKFC進程扇丛,ZKFC負責;

  • 健康監(jiān)測:ZKFC使用一個健康檢查命令定期地ping與之在相同主機的NameNode尉辑,只要該NameNode及時地回復健康狀態(tài)帆精,ZKFC認為該節(jié)點是健康的。如果該節(jié)點崩潰材蹬,凍結或進入不健康狀態(tài)实幕,健康監(jiān)測器標識該節(jié)點為非健康的巩趁。

  • ZooKeeper會話管理:當本地NameNode是健康的氮帐,ZKFC保持一個在ZooKeeper中打開的會話。如果本地NameNode處于active狀態(tài)揩晴,ZKFC也保持一個特殊的znode鎖闸溃,該鎖使用了ZooKeeper對短暫節(jié)點的支持整吆,如果會話終止,鎖節(jié)點將自動刪除辉川。

  • 基于ZooKeeper的選擇:如果本地NameNode是健康的表蝙,且ZKFC發(fā)現(xiàn)沒有其它的節(jié)點當前持有znode鎖,它將為自己獲取該鎖乓旗。如果成功府蛇,則它已經(jīng)贏得了選擇,并負責運行故障轉移進程以使它的本地NameNode為Active屿愚。故障轉移進程與前面描述的手動故障轉移相似汇跨,首先如果必要保護之前的現(xiàn)役NameNode,然后本地NameNode轉換為Active狀態(tài)妆距。

image-20200611185401634

相關資料

image-20200708174358979
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末穷遂,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子娱据,更是在濱河造成了極大的恐慌蚪黑,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,123評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異忌穿,居然都是意外死亡抒寂,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,031評論 2 384
  • 文/潘曉璐 我一進店門伴网,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蓬推,“玉大人,你說我怎么就攤上這事澡腾》蟹” “怎么了?”我有些...
    開封第一講書人閱讀 156,723評論 0 345
  • 文/不壞的土叔 我叫張陵动分,是天一觀的道長毅糟。 經(jīng)常有香客問我,道長澜公,這世上最難降的妖魔是什么姆另? 我笑而不...
    開封第一講書人閱讀 56,357評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮坟乾,結果婚禮上迹辐,老公的妹妹穿的比我還像新娘。我一直安慰自己甚侣,他們只是感情好明吩,可當我...
    茶點故事閱讀 65,412評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著殷费,像睡著了一般印荔。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上详羡,一...
    開封第一講書人閱讀 49,760評論 1 289
  • 那天仍律,我揣著相機與錄音,去河邊找鬼实柠。 笑死水泉,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的窒盐。 我是一名探鬼主播草则,決...
    沈念sama閱讀 38,904評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼登钥!你這毒婦竟也來了?” 一聲冷哼從身側響起娶靡,我...
    開封第一講書人閱讀 37,672評論 0 266
  • 序言:老撾萬榮一對情侶失蹤牧牢,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體塔鳍,經(jīng)...
    沈念sama閱讀 44,118評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡伯铣,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,456評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了轮纫。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片腔寡。...
    茶點故事閱讀 38,599評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖掌唾,靈堂內(nèi)的尸體忽然破棺而出放前,到底是詐尸還是另有隱情,我是刑警寧澤糯彬,帶...
    沈念sama閱讀 34,264評論 4 328
  • 正文 年R本政府宣布凭语,位于F島的核電站,受9級特大地震影響撩扒,放射性物質(zhì)發(fā)生泄漏似扔。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,857評論 3 312
  • 文/蒙蒙 一搓谆、第九天 我趴在偏房一處隱蔽的房頂上張望炒辉。 院中可真熱鬧,春花似錦泉手、人聲如沸黔寇。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,731評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽啡氢。三九已至,卻和暖如春术裸,著一層夾襖步出監(jiān)牢的瞬間倘是,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,956評論 1 264
  • 我被黑心中介騙來泰國打工袭艺, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留搀崭,地道東北人。 一個月前我還...
    沈念sama閱讀 46,286評論 2 360
  • 正文 我出身青樓猾编,卻偏偏與公主長得像瘤睹,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子答倡,可洞房花燭夜當晚...
    茶點故事閱讀 43,465評論 2 348