HDFS

優(yōu)缺點

優(yōu)點:

  • 高容錯性:數(shù)據(jù)自動保存多個副本朴肺;副本丟失后黔牵,自動恢復
  • 適合批處理:移動計算而數(shù)據(jù)留攒;數(shù)據(jù)位置暴露給計算框架
  • 適合大數(shù)據(jù)處理:GB、TB嫉嘀、PB級數(shù)據(jù)炼邀;百萬規(guī)模以上的文件數(shù)量;10K+節(jié)點
  • 可構(gòu)建在廉價機器上:通過多副本提高可靠性剪侮;提供了容錯和恢復機制

缺點:

  • 不適合低延遲數(shù)據(jù)訪問(訂單):毫秒級拭宁;低延遲與高吞吐率
  • 不適合小文件存嚷逋恕:占用NameNode大量內(nèi)存;尋道時間超過讀取時間
  • 并發(fā)寫入杰标、文件隨機修改:一個文件只能有一個寫者兵怯;僅支持append

HDFS架構(gòu)圖

clipboard.png

HDFS數(shù)據(jù)存儲單元(block)

  • 文件被切分成固定大小的數(shù)據(jù)塊:默認數(shù)據(jù)塊大小為64MB,可配置腔剂;若文件大小不到64MB媒区,則單獨存成一個block
  • 一個文件存儲方式:按大小被切分成若干個block,存儲到不同節(jié)點上掸犬;默認情況下每個block都有三個副本
  • block大小和副本通過client端上傳文件時設(shè)置袜漩,文件上傳成功后副本數(shù)可以變更,block size不可變更

NameNode(NN)

  • 主要功能:接受客戶端的讀寫服務(wù)
  • 保存元數(shù)據(jù)信息包括:文件overship和permission湾碎;文件包含哪兒些塊宙攻;block保存在哪兒個DN(由DN啟動時上報)
  • 元數(shù)據(jù)信息在NN啟動后加載到內(nèi)存:元數(shù)據(jù)存儲到硬盤的文件名為fsimage;block的位置信息不會保存到fsimage介褥;edit記錄對元數(shù)據(jù)的操作日志

SecondaryNameNode(SNN)

  • 不是NN的備份(但可以做備份)座掘,它的主要工作是幫助NN合并edits log,減少NN啟動時間
  • SNN執(zhí)行合并時機:根據(jù)配置文件設(shè)置的時間間隔fs.checkpoint.period(默認3600秒)柔滔;根據(jù)配置文件設(shè)置edits log大小fs.checkpoint.size規(guī)定edits文件的最大(默認64MB)

Data Node

  • 存儲數(shù)據(jù)(Block)
  • 啟動DN線程時會向NN匯報Block信息
  • 通過向NN發(fā)送心跳保持與其聯(lián)系(3秒)溢陪,如果NN10分鐘沒有收到DN心跳,則認為其已經(jīng)lost廊遍,并copy其上的block到其他DN

Block的副本放置策略

  • 第一個副本:放置在上傳文件的DN嬉愧;如果是集群外提交,則隨機挑選一臺磁盤不太滿喉前,CPU不太忙的節(jié)點
  • 第二個副本:放置在于第一個副本不同的機架的節(jié)點上
  • 第三個副本:與第二個副本相同機架的節(jié)點
  • 更多副本:隨機節(jié)點

運行機制:

  • 一個名字節(jié)點和多個數(shù)據(jù)節(jié)點
  • 數(shù)據(jù)復制
  • 故障檢測
  • 空間回收機制

HDFS讀流程

clipboard (1).png

HDFS寫流程

clipboard (2).png

安全模式

  1. NN啟動的時候没酣,首先將映像文件(fsimage)載入內(nèi)存,并執(zhí)行編輯日志(edits)中的各項操作
  2. 一旦在內(nèi)存中成功建立文件系統(tǒng)元數(shù)據(jù)的映射卵迂,則創(chuàng)建一個新的fsimage文件(這個操作不需要SNN)和一個空的編輯日志
  3. 此刻NN運行在安全模式裕便。即NN的文件系統(tǒng)對于客戶端來說是只讀的。
  4. 在此階段NN收集各個DN的報告见咒,當數(shù)據(jù)塊達到最小副本數(shù)以上時偿衰,會被認為是安全的,在一定比例的數(shù)據(jù)塊確定為安全后改览,再過若干時間下翎,安全模式結(jié)束
  5. 當檢測到副本數(shù)不足的數(shù)據(jù)塊,該塊會被復制直到達到最小副本數(shù)宝当,系統(tǒng)中數(shù)據(jù)塊的位置并不是由NN維護的视事,而是以塊列表形式存儲在DN中
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市庆揩,隨后出現(xiàn)的幾起案子俐东,更是在濱河造成了極大的恐慌跌穗,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,000評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件虏辫,死亡現(xiàn)場離奇詭異蚌吸,居然都是意外死亡,警方通過查閱死者的電腦和手機砌庄,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,745評論 3 399
  • 文/潘曉璐 我一進店門羹唠,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人鹤耍,你說我怎么就攤上這事肉迫。” “怎么了稿黄?”我有些...
    開封第一講書人閱讀 168,561評論 0 360
  • 文/不壞的土叔 我叫張陵喊衫,是天一觀的道長。 經(jīng)常有香客問我杆怕,道長族购,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,782評論 1 298
  • 正文 為了忘掉前任陵珍,我火速辦了婚禮寝杖,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘互纯。我一直安慰自己瑟幕,他們只是感情好,可當我...
    茶點故事閱讀 68,798評論 6 397
  • 文/花漫 我一把揭開白布留潦。 她就那樣靜靜地躺著只盹,像睡著了一般。 火紅的嫁衣襯著肌膚如雪兔院。 梳的紋絲不亂的頭發(fā)上殖卑,一...
    開封第一講書人閱讀 52,394評論 1 310
  • 那天,我揣著相機與錄音坊萝,去河邊找鬼孵稽。 笑死,一個胖子當著我的面吹牛十偶,可吹牛的內(nèi)容都是我干的菩鲜。 我是一名探鬼主播,決...
    沈念sama閱讀 40,952評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼惦积,長吁一口氣:“原來是場噩夢啊……” “哼接校!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起荣刑,我...
    開封第一講書人閱讀 39,852評論 0 276
  • 序言:老撾萬榮一對情侶失蹤馅笙,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后厉亏,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體董习,經(jīng)...
    沈念sama閱讀 46,409評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,483評論 3 341
  • 正文 我和宋清朗相戀三年爱只,在試婚紗的時候發(fā)現(xiàn)自己被綠了皿淋。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,615評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡恬试,死狀恐怖窝趣,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情训柴,我是刑警寧澤哑舒,帶...
    沈念sama閱讀 36,303評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站幻馁,受9級特大地震影響洗鸵,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜仗嗦,卻給世界環(huán)境...
    茶點故事閱讀 41,979評論 3 334
  • 文/蒙蒙 一膘滨、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧稀拐,春花似錦火邓、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,470評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至砰逻,卻和暖如春鸣驱,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蝠咆。 一陣腳步聲響...
    開封第一講書人閱讀 33,571評論 1 272
  • 我被黑心中介騙來泰國打工踊东, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人刚操。 一個月前我還...
    沈念sama閱讀 49,041評論 3 377
  • 正文 我出身青樓闸翅,卻偏偏與公主長得像,于是被迫代替她去往敵國和親菊霜。 傳聞我的和親對象是個殘疾皇子坚冀,可洞房花燭夜當晚...
    茶點故事閱讀 45,630評論 2 359

推薦閱讀更多精彩內(nèi)容