HDFS中的Erasure Coding糾刪碼是個(gè)什么樣的存在?

一分尸、什么是糾錯(cuò)碼

提起糾錯(cuò)碼就有必要提起HDFS中多副本策略锦聊。在多副本策略下,HDFS中儲(chǔ)存文件箩绍,要存儲(chǔ)三份相同文件孔庭,如果當(dāng)前文件出現(xiàn)丟失,可以通過其他副本進(jìn)行復(fù)制材蛛,恢復(fù)回來圆到。但是磁盤的利用率不高,僅為1/3卑吭。
在Hadoop3.x之后就引入了糾刪碼技術(shù)(Erasure Coding)
糾刪碼技術(shù)(Erasure coding)簡(jiǎn)稱EC芽淡,是一種編碼容錯(cuò)技術(shù)。最早用于通信行業(yè)豆赏,數(shù)據(jù)傳輸中的數(shù)據(jù)恢復(fù)挣菲。它通過對(duì)數(shù)據(jù)進(jìn)行分塊,然后計(jì)算出校驗(yàn)數(shù)據(jù)掷邦,使得各個(gè)部分的數(shù)據(jù)產(chǎn)生關(guān)聯(lián)性白胀。當(dāng)一部分?jǐn)?shù)據(jù)塊丟失時(shí),可以通過剩余的數(shù)據(jù)塊和校驗(yàn)塊計(jì)算出丟失的數(shù)據(jù)塊抚岗。

二或杠、糾錯(cuò)碼優(yōu)缺點(diǎn)

優(yōu)點(diǎn)

1.客戶端緩存數(shù)據(jù)較少;
2.無論文件大小都適用宣蔚;

缺點(diǎn)

1.網(wǎng)絡(luò)帶寬的消耗廷痘,因?yàn)閿?shù)據(jù)恢復(fù)需要去讀其他的數(shù)據(jù)塊和校驗(yàn)塊;
2.進(jìn)行編碼件已,解碼計(jì)算需要消耗CPU資源笋额;

三、糾刪碼策略

RS-3-2-1024k:每組數(shù)據(jù)包含3個(gè)數(shù)據(jù)塊和2個(gè)校驗(yàn)塊篷扩,一共5個(gè)塊兄猩,存儲(chǔ)使用效率3/5=60%,一個(gè)集群最小datanode數(shù)量為5,可允許2個(gè)datanode同時(shí)離線不影響應(yīng)用訪問數(shù)據(jù)枢冤;
RS-6-3-1024k:每組數(shù)據(jù)包含6個(gè)數(shù)據(jù)塊和3個(gè)校驗(yàn)塊鸠姨,一共9個(gè)塊,存儲(chǔ)使用效率6/9=67%淹真,一個(gè)集群最小datanode數(shù)量為9讶迁,可允許3個(gè)datanode同時(shí)離線不影響應(yīng)用訪問數(shù)據(jù);
RS-10-4-1024k:每組數(shù)據(jù)包含10個(gè)數(shù)據(jù)塊和4個(gè)校驗(yàn)塊核蘸,一共14個(gè)塊巍糯,存儲(chǔ)使用效率10/14=71%,一個(gè)集群最小datanode數(shù)量為14客扎,可允許4個(gè)datanode同時(shí)離線不影響應(yīng)用訪問數(shù)據(jù)祟峦;

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市徙鱼,隨后出現(xiàn)的幾起案子宅楞,更是在濱河造成了極大的恐慌,老刑警劉巖袱吆,帶你破解...
    沈念sama閱讀 217,734評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件厌衙,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡绞绒,警方通過查閱死者的電腦和手機(jī)婶希,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來处铛,“玉大人饲趋,你說我怎么就攤上這事拐揭〕敷。” “怎么了?”我有些...
    開封第一講書人閱讀 164,133評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵堂污,是天一觀的道長家肯。 經(jīng)常有香客問我,道長盟猖,這世上最難降的妖魔是什么讨衣? 我笑而不...
    開封第一講書人閱讀 58,532評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮式镐,結(jié)果婚禮上反镇,老公的妹妹穿的比我還像新娘。我一直安慰自己娘汞,他們只是感情好歹茶,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,585評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般惊豺。 火紅的嫁衣襯著肌膚如雪燎孟。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,462評(píng)論 1 302
  • 那天尸昧,我揣著相機(jī)與錄音揩页,去河邊找鬼。 笑死烹俗,一個(gè)胖子當(dāng)著我的面吹牛爆侣,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播衷蜓,決...
    沈念sama閱讀 40,262評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼累提,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了磁浇?” 一聲冷哼從身側(cè)響起斋陪,我...
    開封第一講書人閱讀 39,153評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎置吓,沒想到半個(gè)月后无虚,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,587評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡衍锚,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,792評(píng)論 3 336
  • 正文 我和宋清朗相戀三年友题,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片戴质。...
    茶點(diǎn)故事閱讀 39,919評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡度宦,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出告匠,到底是詐尸還是另有隱情戈抄,我是刑警寧澤,帶...
    沈念sama閱讀 35,635評(píng)論 5 345
  • 正文 年R本政府宣布后专,位于F島的核電站划鸽,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏戚哎。R本人自食惡果不足惜裸诽,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,237評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望型凳。 院中可真熱鬧丈冬,春花似錦、人聲如沸甘畅。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至粒梦,卻和暖如春亮航,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背匀们。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評(píng)論 1 269
  • 我被黑心中介騙來泰國打工缴淋, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人泄朴。 一個(gè)月前我還...
    沈念sama閱讀 48,048評(píng)論 3 370
  • 正文 我出身青樓重抖,卻偏偏與公主長得像,于是被迫代替她去往敵國和親祖灰。 傳聞我的和親對(duì)象是個(gè)殘疾皇子钟沛,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,864評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容