揭開hdfs的面紗

前言

這一篇感覺是進(jìn)入hadoop生態(tài)圈的第一步澈魄，了解hdfs的構(gòu)造俯树。

hdfs設(shè)計(jì)的初衷

其實(shí)hdfs是山寨的gfs丸冕，是開源社區(qū)的仿造關(guān)于gfs的那篇論文開發(fā)出來(lái)的分布式文件系統(tǒng)沫勿。所以hdfs和gfs的設(shè)計(jì)目的初衷時(shí)相同的综液。

超大文件（TB款慨，PB級(jí)文件）
高容錯(cuò)性（保證數(shù)據(jù)的不丟失）
高吞吐量

hdfs的優(yōu)點(diǎn)

可以滿足大數(shù)據(jù)量的存儲(chǔ)
使用普通低廉的硬盤設(shè)備，但是硬盤損壞后數(shù)據(jù)不會(huì)丟失谬莹。
使用廉價(jià)硬盤檩奠，但是整體讀寫性能較好

hdfs的缺點(diǎn)

不適合小數(shù)據(jù)
讀取延遲時(shí)間長(zhǎng)
隨機(jī)讀取能力差
架構(gòu)復(fù)雜

hdfs怎么保存超大文件

假設(shè)有一個(gè)100T的文件桩了，但是硬盤最大的只有1T，所以這些數(shù)據(jù)就要使用100塊硬盤埠戳。這其實(shí)就是文件的分塊存儲(chǔ)井誉，hdfs在軟件的級(jí)別上實(shí)現(xiàn)了文件的分塊存儲(chǔ)。

圖一(假設(shè)64位操作系統(tǒng))

hdfs為什么可以保證數(shù)據(jù)不丟失

保證數(shù)據(jù)不丟失基本只有一種方式——冗余數(shù)據(jù)整胃。在hdfs用默認(rèn)所有的數(shù)據(jù)塊都會(huì)有3份備份颗圣，具體幾份可以自己設(shè)定。

圖二

hdfs為什么硬盤低廉也可以實(shí)現(xiàn)高吞吐

假設(shè)由1T的數(shù)據(jù)屁使，如果由一塊普通的硬盤存儲(chǔ)在岂，將數(shù)據(jù)全部讀出需要2.5個(gè)小時(shí)，但是如果有10塊硬盤蛮寂，將數(shù)據(jù)分塊存儲(chǔ)在10個(gè)硬盤里蔽午，進(jìn)行并行的讀取，速度就提高了10倍酬蹋。hdfs的原理也是相同的及老。

hdfs為什么不適合小數(shù)據(jù)

不是hdfs不能存儲(chǔ)小數(shù)據(jù)，而是存儲(chǔ)小數(shù)據(jù)的時(shí)候性能不如linux文件系統(tǒng)（原因后續(xù)會(huì)講）除嘹，所以不適合写半。

hdfs為什么讀取延遲長(zhǎng)

hdfs為了提高吞吐量，每次需要初始化尉咕，啟動(dòng)時(shí)間較長(zhǎng)叠蝇，所以讀取延遲增加。

結(jié)尾語(yǔ)

計(jì)算機(jī)的技術(shù)雖然不同年缎，但是想法都是共同的悔捶，比如這里提升吞吐量就是并行，保證數(shù)據(jù)不丟失只有備份冗余单芜，對(duì)大文件也只有分塊存儲(chǔ)蜕该。

最后編輯于：2017.12.03 03:52:43

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市洲鸠，隨后出現(xiàn)的幾起案子堂淡，更是在濱河造成了極大的恐慌，老刑警劉巖扒腕，帶你破解...
沈念sama閱讀 217,542評(píng)論 6贊 504
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件绢淀，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡瘾腰，警方通過查閱死者的電腦和手機(jī)皆的，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,822評(píng)論 3贊 394
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)蹋盆，“玉大人费薄，你說我怎么就攤上這事硝全。” “怎么了楞抡？”我有些...
開封第一講書人閱讀 163,912評(píng)論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵伟众，是天一觀的道長(zhǎng)。經(jīng)常有香客問我拌倍，道長(zhǎng)赂鲤，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,449評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任柱恤，我火速辦了婚禮数初，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘梗顺。我一直安慰自己泡孩，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,500評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開白布寺谤。她就那樣靜靜地躺著仑鸥，像睡著了一般。火紅的嫁衣襯著肌膚如雪变屁。梳的紋絲不亂的頭發(fā)上眼俊，一...
開封第一講書人閱讀 51,370評(píng)論 1贊 302
城市分裂傳說
那天，我揣著相機(jī)與錄音粟关，去河邊找鬼疮胖。笑死，一個(gè)胖子當(dāng)著我的面吹牛闷板，可吹牛的內(nèi)容都是我干的澎灸。我是一名探鬼主播，決...
沈念sama閱讀 40,193評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼遮晚，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼性昭！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起县遣，我...
開封第一講書人閱讀 39,074評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤糜颠，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后萧求，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體括蝠，經(jīng)...
沈念sama閱讀 45,505評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,722評(píng)論 3贊 335
?白月光啟示錄
正文我和宋清朗相戀三年饭聚，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片搁拙。...
茶點(diǎn)故事閱讀 39,841評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡秒梳，死狀恐怖法绵，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情酪碘，我是刑警寧澤朋譬，帶...
沈念sama閱讀 35,569評(píng)論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站兴垦，受9級(jí)特大地震影響徙赢，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜探越，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,168評(píng)論 3贊 328
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一狡赐、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧钦幔，春花似錦枕屉、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,783評(píng)論 0贊 22
一樁弒父案搀擂，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至卷玉，卻和暖如春哨颂，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背相种。一陣腳步聲響...
開封第一講書人閱讀 32,918評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工威恼，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人蚂子。一個(gè)月前我還...
沈念sama閱讀 47,962評(píng)論 2贊 370
代替公主和親
正文我出身青樓沃测，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親食茎。傳聞我的和親對(duì)象是個(gè)殘疾皇子蒂破，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,781評(píng)論 2贊 354