十萬個為什么（hadoop 1期）？

納尼寞射？納尼渔工？納尼稀并？

1.什么是map的數(shù)據(jù)本地化優(yōu)化厨剪？

????Hadoop 在存儲有輸入數(shù)據(jù)（hdfs中的數(shù)據(jù)）的節(jié)點上運行map任務(wù)澡为，可以獲得最佳性能烦粒，因為他無需使用寶貴的集群帶寬資源遭庶。這就是所謂的數(shù)據(jù)本地化優(yōu)化拐云，但是有時對于一個map任務(wù)的輸入分片來說颤殴，存儲該分片的hdfs數(shù)據(jù)塊副本的所有節(jié)點可能正在運行其他map任務(wù)杭跪，此時作業(yè)調(diào)度需要從某一數(shù)據(jù)塊所在的機架中的一個節(jié)點上尋找一個空閑的map槽（slot）來運行該map任務(wù)分片通惫。僅僅在非常偶然的情況下茂翔，會使用其他機架中的節(jié)點運行該map 任務(wù)，這將導(dǎo)致機架與機架之間的網(wǎng)絡(luò)傳輸履腋。

2.為什么map最佳分片大小與塊大小相同珊燎？

????因為它是確保可以存儲在單個節(jié)點上的最大輸入塊的大小遵湖，如果分片跨越兩個數(shù)據(jù)塊悔政，那么對于任何一個hdfs節(jié)點，基本上都不可能同時存儲這兩個數(shù)據(jù)塊延旧，因此分片中的部分數(shù)據(jù)需要通過網(wǎng)絡(luò)傳輸?shù)絤ap任務(wù)運行的節(jié)點谋国，與使用本地數(shù)據(jù)運行整個mao任務(wù)相比，這種方法顯然效率更低迁沫。

3.map任務(wù)將其輸入寫入本地硬盤芦瘾，而非hdfs,這是為什么捌蚊？

????因為map的輸出是中間結(jié)果，該中間結(jié)果由reduce任務(wù)處理后才產(chǎn)生最終輸出結(jié)果近弟，一旦完成缅糟，map的輸出結(jié)果就可以刪除。因此如果把他存儲在hdfs中并實現(xiàn)備份祷愉，難免有些小題大做窗宦。如果運行map任務(wù)的節(jié)點在將map中間結(jié)果傳送給reduce任務(wù)之前失敗，hadoop 將在另一個節(jié)點上重新運行這個map以再次構(gòu)建map中間結(jié)果二鳄。

? ??Hdfs 的塊比磁盤的塊大赴涵，其目的是為了最小化尋址開銷。如果塊足夠大泥从，從磁盤傳輸數(shù)據(jù)的時間會明顯大于定位這個塊開始位置所需的時間。因而沪摄，傳輸一個由多個塊組成的大文件的時間取決于磁盤傳輸速率躯嫉。

但是這個參數(shù)也不會設(shè)置的過大，mr中的map任務(wù)通常一次只處理一個塊中的數(shù)據(jù)杨拐，因此如果任務(wù)數(shù)太少祈餐，作業(yè)的運行速度就會比較慢。?

5.hdfs 中塊進行抽象的好處是什么?

?>1 一個文件的大小可以大于網(wǎng)絡(luò)中任意一個磁盤的容量哄陶。文件的所有塊并不需要存儲在同一個磁盤上帆阳。

?>2 使用抽象塊而非整個文件作為存儲單元，大大簡化了存儲子系統(tǒng)的設(shè)計屋吨。對于故障種類繁多的分布式系統(tǒng)來說尤為重要

?>3 塊還非常適合用于數(shù)據(jù)備份進而提供數(shù)據(jù)容錯能力和提高可用性?

6.hadoop 對于namenode單點問題有哪些容錯機制蜒谤？

>1 備份那些組成文件系統(tǒng)運輸局持久狀態(tài)的文件，Hadoop 可以通過配置使namenode在多個文件系統(tǒng)上保存元數(shù)據(jù)的持久狀態(tài)至扰。這些寫操作是實時同步的鳍徽，且是原子操作。一般的配置是敢课，將持久狀態(tài)寫入本地磁盤的同時阶祭，寫入一個遠程掛載的網(wǎng)絡(luò)文件系統(tǒng)（NFS）。

?>2 運行一個輔助namenode,但它不能被用作namenode,這個輔助namenode的重要作用是定期合并編輯日志與命名空間鏡像直秆，以防止編輯日志過大濒募。這個輔助namenode 一般在另一臺單獨的物理計算機上運行，因為他需要占用大量cpu時間圾结，并且需要與namenode 一樣多的內(nèi)存執(zhí)行合并操作瑰剃。?

7.hadoop2 對hdfs 高可用（HA）是怎么做的？

????配置活動-備用（active-standby）namenode,當活動namenode失效筝野，備用namenode就會接管他的任務(wù)并開始服務(wù)與來自客戶端的請求培他，不會有任何明顯中斷鹃两。

?? ?1.namenode之間通過高可用共享存儲（NFS或QJM）實現(xiàn)編輯日志的共享，只有活動namenode才能對外提供讀寫服務(wù)舀凛，活動namenode把editlog寫入JN中俊扳，備用namenode從JN中獲取editlog合并到FsImage中，當備用的namenode接管工作之后猛遍，它將通讀共享編輯日志直至末尾馋记，以實現(xiàn)與活動namenode的狀態(tài)同步，并繼續(xù)讀取由活動namenode寫入的新條目懊烤。

? ? 2.datanode同時向namenode發(fā)送數(shù)據(jù)塊處理報告梯醒，因為數(shù)據(jù)塊的映射信息存儲在namenode的內(nèi)存里，而非磁盤腌紧。

? ? 3.客戶端需要使用特定的機制來處理namenode的失效問題茸习，這一機制對用戶是透明的

? ? 4.輔助namenode的角色被備用namenode所包含，備用namenode為活動namenode命名空間設(shè)置周期性檢查點

? ? 5.為了實現(xiàn)熱備壁肋，增加FailoverController（故障轉(zhuǎn)移控制器）和Zookeeper号胚，F(xiàn)ailoverController與Zookeeper通信，通過Zookeeper選舉機制浸遗，F(xiàn)ailoverController通過RPC讓NameNode轉(zhuǎn)換為Active或Standby猫胁。?

知識點：

NFS（Network File System 網(wǎng)絡(luò)文件系統(tǒng)）

?? NFS作為active namenode和standby namenode之間數(shù)據(jù)共享的存儲。

?? active namenode會把最近的edits文件寫到NFS跛锌，而standby namenode從NFS中把數(shù)據(jù)讀過來弃秆。

???這個方式的缺點是，如果active或standby有一個和NFS之間網(wǎng)絡(luò)有問題髓帽，則會造成他們之前數(shù)據(jù)的同步出問題菠赚。并且不能保證同一時間只有一個namenode向NFS中寫入數(shù)據(jù)

QJM（Quorum Journal Manager 群體日志管理器）【目前hadoop2.x使用】

?? QJM是一個專用的HDFS實現(xiàn)，提供了一個高可用的編輯日志郑藏。這種方式可以解決上述NFS容錯機制不足的問題锈至。

???同一時間QJM僅允許一個namenode向編輯日志中寫入數(shù)據(jù)。

故障轉(zhuǎn)移控制器（failover controller）译秦，管理著將活動namenode轉(zhuǎn)移為備用namenode的轉(zhuǎn)換過程峡捡。有多重故障轉(zhuǎn)移控制器，但默認的一種是使用了zookeeper來確保有且僅有一個活動namenode筑悴。每一個namenode運行著一個輕量級的故障轉(zhuǎn)移控制器们拙。其工作就是監(jiān)視宿主namenode是否失效（通過一個簡單的心跳機制實現(xiàn)）并在namenode失效時進行故障轉(zhuǎn)移管理員也可以手動發(fā)起故障轉(zhuǎn)移，例如在日常維護時阁吝。

JN:active和standby之間是通過一組日志節(jié)點journal node（數(shù)量是奇數(shù)砚婆，可以是3,5,7...,2n+1）來共享數(shù)據(jù)。active把最近的edits文件寫到2n+1個journal node上，只要有n+1個寫入成功,就認為這次寫入操作成功了装盯。然后standby就可以從journalnode上讀取了坷虑。QJM方式有容錯的機制，可以容忍n個journalnode的失敗埂奈。??

最后編輯于：2020.12.01 11:12:52

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末迄损，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子账磺，更是在濱河造成了極大的恐慌芹敌，老刑警劉巖，帶你破解...
沈念sama閱讀 222,729評論 6贊 517
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件垮抗，死亡現(xiàn)場離奇詭異氏捞，居然都是意外死亡，警方通過查閱死者的電腦和手機冒版，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 95,226評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門液茎，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人辞嗡，你說我怎么就攤上這事捆等。” “怎么了欲间？”我有些...
開封第一講書人閱讀 169,461評論 0贊 362
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵楚里，是天一觀的道長断部。經(jīng)常有香客問我猎贴，道長，這世上最難降的妖魔是什么蝴光？我笑而不...
開封第一講書人閱讀 60,135評論 1贊 300
?港島之戀（遺憾婚禮）
正文為了忘掉前任她渴，我火速辦了婚禮，結(jié)果婚禮上蔑祟，老公的妹妹穿的比我還像新娘趁耗。我一直安慰自己，他們只是感情好疆虚，可當我...
茶點故事閱讀 69,130評論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布苛败。她就那樣靜靜地躺著，像睡著了一般径簿。火紅的嫁衣襯著肌膚如雪罢屈。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 52,736評論 1贊 312
城市分裂傳說
那天篇亭，我揣著相機與錄音缠捌，去河邊找鬼。笑死译蒂，一個胖子當著我的面吹牛曼月，可吹牛的內(nèi)容都是我干的谊却。我是一名探鬼主播，決...
沈念sama閱讀 41,179評論 3贊 422
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼哑芹，長吁一口氣：“原來是場噩夢啊……” “哼炎辨！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起绩衷，我...
開封第一講書人閱讀 40,124評論 0贊 277
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤蹦魔，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后咳燕，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體勿决，經(jīng)...
沈念sama閱讀 46,657評論 1贊 320
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 38,723評論 3贊 342
?白月光啟示錄
正文我和宋清朗相戀三年招盲，在試婚紗的時候發(fā)現(xiàn)自己被綠了低缩。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,872評論 1贊 353
活死人
序言：一個原本活蹦亂跳的男人離奇死亡曹货，死狀恐怖咆繁，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情顶籽，我是刑警寧澤玩般，帶...
沈念sama閱讀 36,533評論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站礼饱，受9級特大地震影響坏为，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜镊绪，卻給世界環(huán)境...
茶點故事閱讀 42,213評論 3贊 336
男人毒藥：我在死后第九天來索命
文/蒙蒙一匀伏、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧蝴韭，春花似錦够颠、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,700評論 0贊 25
一樁弒父案履磨，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至庆尘，卻和暖如春剃诅，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背减余。一陣腳步聲響...
開封第一講書人閱讀 33,819評論 1贊 274
情欲美人皮
我被黑心中介騙來泰國打工综苔，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 49,304評論 3贊 379
代替公主和親
正文我出身青樓如筛，卻偏偏與公主長得像堡牡，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子杨刨，可洞房花燭夜當晚...
茶點故事閱讀 45,876評論 2贊 361

十萬個為什么（hadoop 1期）墩弯？

十萬個為什么（hadoop 1期）？

推薦閱讀更多精彩內(nèi)容