HDFS NameNode HA環(huán)境部署

為什么要搭建NameNode HA坯墨?

因?yàn)閔adoop中NameNode存在單節(jié)點(diǎn)故障堤魁。hadoop1.x 中的Secondarynamenode僅僅使用了合并namenode中的edit文件和fsimage文件(并做備份)精置,防止edit文件過(guò)大丧慈,NameNode重啟時(shí)會(huì)讀取大量的編輯文件,導(dǎo)致啟動(dòng)很慢玩祟。但是它只是namenode的一個(gè)協(xié)助節(jié)點(diǎn)靡馁,在namenode出現(xiàn)故障后欲鹏,不能由它來(lái)接手namenode。

NameNode HA原理

QQ圖片20161016183256.png
  1. 首先由兩個(gè)namenode節(jié)點(diǎn)奈嘿,為了保持兩個(gè)NameNode內(nèi)存中存儲(chǔ)文件系統(tǒng)的系統(tǒng)元數(shù)據(jù)要同步(fsimage和edit等文件)貌虾。所以通過(guò)配置Quorum Journal Node節(jié)點(diǎn),一個(gè)namenode節(jié)點(diǎn)向JN節(jié)點(diǎn)寫入要共享的數(shù)據(jù)裙犹,另外一個(gè)namenode節(jié)點(diǎn)從JN節(jié)點(diǎn)讀數(shù)據(jù)。為了保證共享數(shù)據(jù)的安全性衔憨,JN節(jié)點(diǎn)也為多個(gè)叶圃。
  2. 如果同時(shí)又兩個(gè)namenode節(jié)點(diǎn)對(duì)外提供訪問(wèn),會(huì)導(dǎo)致數(shù)據(jù)的不一致性践图。所以要保證一個(gè)為active狀態(tài)掺冠,另外一個(gè)為standby(備用)狀態(tài)。同時(shí)當(dāng)active宕掉,為了standby能夠迅速轉(zhuǎn)換為active狀態(tài)德崭,所以datanode需要同時(shí)向這兩個(gè)namenode節(jié)點(diǎn)發(fā)送數(shù)據(jù)位置信息和心跳斥黑。
  3. 需要配置隔離機(jī)制來(lái)保證有且僅有一個(gè)namenode對(duì)外提供服務(wù)。防止裂腦(兩個(gè)namenode節(jié)點(diǎn)都可以命令datanode)的發(fā)生眉厨。
  4. 客戶端不知道向哪一個(gè)namenode為活動(dòng)狀態(tài)锌奴,所以也不知道向哪一個(gè)節(jié)點(diǎn)發(fā)送請(qǐng)求。需要在前面加一層代理憾股,讓代理來(lái)決定訪問(wèn)哪一臺(tái)機(jī)器鹿蜀。
  5. 前面的問(wèn)題解決后,active和standby之前的切換必須手動(dòng)服球。結(jié)合Zookeeper集群中Zookeeper faileover controller(ZKFC)故障轉(zhuǎn)移監(jiān)控器 來(lái)監(jiān)控節(jié)點(diǎn)并自動(dòng)的將standby切換到active茴恰。

HA配置步驟

  1. 對(duì)hdfs-site.xml文件進(jìn)行配置,并分發(fā)到其余兩個(gè)節(jié)點(diǎn)
        <!-- 為這個(gè)namenode集群設(shè)置一個(gè)命名-->
        <property>
                <name>dfs.nameservices</name>
                <value>ns1</value>
        </property>
        <!-- 這個(gè)nameservices節(jié)點(diǎn)下namenode的命名 -->
        <property>
                <name>dfs.ha.namenodes.ns1</name>
                <value>nn1,nn2</value>
        </property>
       <!-- 配置兩個(gè)namenode節(jié)點(diǎn)的位置 -->
        <property>
                <name>dfs.namenode.rpc-address.ns1.nn1</name>
                <value>bigdata-00:8020</value>
        </property>
        <property>
                <name>dfs.namenode.rpc-address.ns1.nn2</name>
                <value>bigdata-01:8020</value>
        </property>
        <!-- 配置兩臺(tái)namenode外部web UI 端口 -->
        <property>
                <name>dfs.namenode.http-address.ns1.nn1</name>
                <value>bigdata-00:50070</value>
        <property>
        </property>
        </property>
        <property>
                <name>dfs.namenode.http-address.ns1.nn2</name>
                <value>bigdata-01:50070</value>
        </property>        
        <!-- 編輯日志文件存儲(chǔ)的節(jié)點(diǎn)(JN) -->
        <property>
                <name>dfs.namenode.shared.edits.dir</name>
                <value>qjournal://bigdata-00:8485;bigdata-01:8485;bigdata-02:8485/ns1</value>
        </property>
        <!-- 各個(gè)JN節(jié)點(diǎn)存放日志文件位置 -->
        <property>
                <name>dfs.journalnode.edits.dir</name>
                <value>/opt/app/hadoop-2.5.0/data/dfs/jn</value>
        </property>
        <!-- 配置HDFS客戶端去連接active namenode節(jié)點(diǎn) -->
        <property>     
                <name>dfs.client.failover.proxy.provider.ns1</name>
                <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</va
lue>
        </property>
        <!-- 配置隔離機(jī)制-->
        <property>
                 <name>dfs.ha.fencing.methods</name>
                  <value>sshfence</value>
        </property>
        <property>
                <name>dfs.ha.fencing.ssh.private-key-files</name>
                <value>/home/wulei/.ssh/id_rsa</value>
        </property>
  1. 對(duì)core-site.xml文件進(jìn)行配置
        <!-- 指定namenode存儲(chǔ)元數(shù)據(jù)和日志文件的目錄 -->
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/opt/app/hadoop-2.5.0/data/tmp</value>
        </property>
        <!-- 配置nameservices作為文件系統(tǒng)-->
        <property>
                  <name>fs.defaultFS</name>
                  <value>hdfs://ns1</value>
        </property>
  1. 每個(gè)節(jié)點(diǎn)啟動(dòng)journalnode和namenode服務(wù)
  • 三個(gè)節(jié)點(diǎn)啟動(dòng)journalnode服務(wù)斩熊。


    jn1.png
  • 對(duì)其中一個(gè)namenode進(jìn)行格式化

[wulei@bigdata-00 hadoop-2.5.0]$ bin/hdfs namenode -format

  • 啟動(dòng)namenode服務(wù),查看節(jié)點(diǎn)狀態(tài)

[wulei@bigdata-00 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start namenode
starting namenode, logging to /opt/app/hadoop-2.5.0/logs/hadoop-wulei-namenode-bigdata-00.out
[wulei@bigdata-00 hadoop-2.5.0]$ jps
5095 JournalNode
5338 NameNode
5406 Jps

nn1.png
  • 把nn1的fsimage文件同步到nn2上,再啟動(dòng)nn2中的namenode查看狀態(tài)往枣。


    nn2.png

    nn3.png
  • 手動(dòng)切換nn1的狀態(tài)為active,并啟動(dòng)三個(gè)datanode節(jié)點(diǎn)

$ bin/hdfs haadmin -transitionToActive nn1

nn4.png

dn1.png
  1. 測(cè)試兩個(gè)namenode之間數(shù)據(jù)是否能同步(在active節(jié)點(diǎn)上創(chuàng)建目錄粉渠,然后結(jié)束這個(gè)active nemenode節(jié)點(diǎn)婉商,把另外一個(gè)standby節(jié)點(diǎn)轉(zhuǎn)換為active節(jié)點(diǎn),看是否能訪問(wèn)目錄)

[wulei@bigdata-00 hadoop-2.5.0]$ bin/hdfs dfs -mkdir /test
[wulei@bigdata-00 hadoop-2.5.0]$ bin/hdfs dfs -ls /
Found 1 items
drwxr-xr-x - wulei supergroup 0 2016-10-21 10:31 /test
[wulei@bigdata-01 hadoop-2.5.0]$ bin/hdfs haadmin -transitionToActive nn2 --forceactive
[wulei@bigdata-01 hadoop-2.5.0]$ bin/hdfs dfs -ls /
Found 1 items
drwxr-xr-x - wulei supergroup 0 2016-10-21 10:31 /test

  1. 借助zookeeper集群來(lái)配置namenode HA自動(dòng)故障轉(zhuǎn)移
  • 在部署好zookeeper集群后并啟動(dòng)進(jìn)程

[wulei@bigdata-00 hadoop-2.5.0]$ jps
9155 QuorumPeerMain
[wulei@bigdata-01 hadoop-2.5.0]$ jps
5195 QuorumPeerMain
[wulei@bigdata-02 hadoop-2.5.0]$ jps
3886 QuorumPeerMain

  • 對(duì)文件增加配置渣叛,并分發(fā)給其他節(jié)點(diǎn)
    hdfs-site.xml
<!-- 啟動(dòng)自動(dòng)故障轉(zhuǎn)移功能-->
<property>
       <name>dfs.ha.automatic-failover.enabled</name>
       <value>true</value>
 </property>

core-site.xml

<!-- zookeeper高可用的主機(jī)和端口-->
    <property>
        <name>ha.zookeeper.quorum</name>
        <value>bigdata-00:2181,bigdata-01:2181,bigdata-02:2181</value>
    </property>
  • 初始化zookeeper HA狀態(tài)丈秩,生成znode節(jié)點(diǎn)(每個(gè)節(jié)點(diǎn)對(duì)應(yīng)一個(gè)目錄)

[wulei@bigdata-00 hadoop-2.5.0]$ bin/hdfs zkfc -formatZK

  • 客戶端連接zookeeper,查看節(jié)點(diǎn)是否創(chuàng)建成功

[wulei@bigdata-00 hadoop-2.5.0]$ zookeeper-3.4.6/bin/zkCli.sh
[zk: localhost:2181(CONNECTED) 3] ls /
[zookeeper, hadoop-ha]
[zk: localhost:2181(CONNECTED) 4] ls /hadoop-ha
[ns1]

  • 啟動(dòng)集群服務(wù)進(jìn)程后淳衙,在兩個(gè)namonode節(jié)點(diǎn)上啟動(dòng)ZKFC服務(wù)

[wulei@bigdata-00 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start zkfc
[wulei@bigdata-01 hadoop-2.5.0]$ sbin/hadoop-daemon.sh start zkfc

  • 查看兩個(gè)namenode節(jié)點(diǎn)狀態(tài)蘑秽。可以發(fā)現(xiàn)已經(jīng)通過(guò)選舉自動(dòng)選出了一個(gè)active箫攀,另外一個(gè)作為standby肠牲。


    zk1.png

    zk2.png
  • 啟動(dòng)resourcemanager和nodemanager。在active上運(yùn)行mapreduce程序靴跛,中途關(guān)閉active的節(jié)點(diǎn)后缀雳,查看程序運(yùn)行情況和nn2的狀態(tài)。會(huì)發(fā)現(xiàn)程序任然可以執(zhí)行梢睛,為standby狀態(tài)的節(jié)點(diǎn)自動(dòng)轉(zhuǎn)換為active肥印。

[wulei@bigdata-00 hadoop-2.5.0]$ bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar wordcount /test/in/ /test/out

tt1.png

tt2.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市绝葡,隨后出現(xiàn)的幾起案子深碱,更是在濱河造成了極大的恐慌,老刑警劉巖藏畅,帶你破解...
    沈念sama閱讀 222,104評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件敷硅,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)绞蹦,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,816評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門力奋,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人幽七,你說(shuō)我怎么就攤上這事景殷。” “怎么了锉走?”我有些...
    開封第一講書人閱讀 168,697評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵滨彻,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我挪蹭,道長(zhǎng)亭饵,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,836評(píng)論 1 298
  • 正文 為了忘掉前任梁厉,我火速辦了婚禮辜羊,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘词顾。我一直安慰自己八秃,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,851評(píng)論 6 397
  • 文/花漫 我一把揭開白布肉盹。 她就那樣靜靜地躺著昔驱,像睡著了一般。 火紅的嫁衣襯著肌膚如雪上忍。 梳的紋絲不亂的頭發(fā)上骤肛,一...
    開封第一講書人閱讀 52,441評(píng)論 1 310
  • 那天,我揣著相機(jī)與錄音窍蓝,去河邊找鬼腋颠。 笑死,一個(gè)胖子當(dāng)著我的面吹牛吓笙,可吹牛的內(nèi)容都是我干的淑玫。 我是一名探鬼主播,決...
    沈念sama閱讀 40,992評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼面睛,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼絮蒿!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起侮穿,我...
    開封第一講書人閱讀 39,899評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤歌径,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后亲茅,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,457評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,529評(píng)論 3 341
  • 正文 我和宋清朗相戀三年克锣,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了茵肃。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,664評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡袭祟,死狀恐怖验残,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情巾乳,我是刑警寧澤您没,帶...
    沈念sama閱讀 36,346評(píng)論 5 350
  • 正文 年R本政府宣布,位于F島的核電站胆绊,受9級(jí)特大地震影響氨鹏,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜压状,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,025評(píng)論 3 334
  • 文/蒙蒙 一仆抵、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧种冬,春花似錦镣丑、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,511評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至十兢,卻和暖如春趣竣,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背纪挎。 一陣腳步聲響...
    開封第一講書人閱讀 33,611評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工期贫, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人异袄。 一個(gè)月前我還...
    沈念sama閱讀 49,081評(píng)論 3 377
  • 正文 我出身青樓通砍,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親烤蜕。 傳聞我的和親對(duì)象是個(gè)殘疾皇子封孙,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,675評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容

  • 簡(jiǎn)述 hadoop 集群一共有4種部署模式,詳見《hadoop 生態(tài)圈介紹》讽营。HA聯(lián)邦模式解決了單純HA模式的性能...
    mtide閱讀 12,973評(píng)論 8 20
  • 簡(jiǎn)述 hadoop 集群一共有4種部署模式虎忌,詳見《hadoop 生態(tài)圈介紹》。HA模式的集群里面會(huì)部署兩臺(tái)NN(最...
    mtide閱讀 7,027評(píng)論 0 10
  • 之前的有點(diǎn)忘記了,這里在云筆記拿出來(lái)再玩玩.看不懂的可以留言 大家可以嘗試下Ambari來(lái)配置Hadoop的相關(guān)環(huán)...
    HT_Jonson閱讀 2,967評(píng)論 0 50
  • 官方文檔翻譯橱鹏,官方鏈接膜蠢。翻譯水平有限堪藐,且以學(xué)習(xí)為主,請(qǐng)諒解和提意見挑围。轉(zhuǎn)載請(qǐng)注明出處=妇骸!杉辙! 接著上一篇發(fā)布的文章繼續(xù)...
    mikeliuy閱讀 1,052評(píng)論 1 3
  • 今天把QQ聯(lián)系人整了個(gè)遍模捂,發(fā)現(xiàn)好多朋友許久沒(méi)有聯(lián)系了。有幾個(gè)特別想發(fā)個(gè)消息過(guò)去蜘矢,問(wèn)問(wèn)他們的近況狂男。可是在摁下“發(fā)送”...
    JANEC閱讀 2,002評(píng)論 26 51