揭開hdfs的面紗

前言

這一篇感覺是進(jìn)入hadoop生態(tài)圈的第一步澈魄,了解hdfs的構(gòu)造俯树。

hdfs設(shè)計(jì)的初衷

其實(shí)hdfs是山寨的gfs丸冕,是開源社區(qū)的仿造關(guān)于gfs的那篇論文開發(fā)出來(lái)的分布式文件系統(tǒng)沫勿。所以hdfs和gfs的設(shè)計(jì)目的初衷時(shí)相同的综液。

  • 超大文件(TB款慨,PB級(jí)文件)
  • 高容錯(cuò)性 (保證數(shù)據(jù)的不丟失)
  • 高吞吐量

hdfs的優(yōu)點(diǎn)

  • 可以滿足大數(shù)據(jù)量的存儲(chǔ)
  • 使用普通低廉的硬盤設(shè)備,但是硬盤損壞后數(shù)據(jù)不會(huì)丟失谬莹。
  • 使用廉價(jià)硬盤檩奠,但是整體讀寫性能較好

hdfs的缺點(diǎn)

  • 不適合小數(shù)據(jù)
  • 讀取延遲時(shí)間長(zhǎng)
  • 隨機(jī)讀取能力差
  • 架構(gòu)復(fù)雜

hdfs怎么保存超大文件

假設(shè)有一個(gè)100T的文件桩了,但是硬盤最大的只有1T,所以這些數(shù)據(jù)就要使用100塊硬盤埠戳。這其實(shí)就是文件的分塊存儲(chǔ)井誉,hdfs在軟件的級(jí)別上實(shí)現(xiàn)了文件的分塊存儲(chǔ)。

圖一(假設(shè)64位操作系統(tǒng))

hdfs為什么可以保證數(shù)據(jù)不丟失

保證數(shù)據(jù)不丟失基本只有一種方式——冗余數(shù)據(jù)整胃。在hdfs用默認(rèn)所有的數(shù)據(jù)塊都會(huì)有3份備份颗圣,具體幾份可以自己設(shè)定。

圖二

hdfs為什么硬盤低廉也可以實(shí)現(xiàn)高吞吐

假設(shè)由1T的數(shù)據(jù)屁使,如果由一塊普通的硬盤存儲(chǔ)在岂,將數(shù)據(jù)全部讀出需要2.5個(gè)小時(shí),但是如果有10塊硬盤蛮寂,將數(shù)據(jù)分塊存儲(chǔ)在10個(gè)硬盤里蔽午,進(jìn)行并行的讀取,速度就提高了10倍酬蹋。hdfs的原理也是相同的及老。

hdfs為什么不適合小數(shù)據(jù)

不是hdfs不能存儲(chǔ)小數(shù)據(jù),而是存儲(chǔ)小數(shù)據(jù)的時(shí)候性能不如linux文件系統(tǒng)(原因后續(xù)會(huì)講)除嘹,所以不適合写半。

hdfs為什么讀取延遲長(zhǎng)

hdfs為了提高吞吐量,每次需要初始化尉咕,啟動(dòng)時(shí)間較長(zhǎng)叠蝇,所以讀取延遲增加。

結(jié)尾語(yǔ)

計(jì)算機(jī)的技術(shù)雖然不同年缎,但是想法都是共同的悔捶,比如這里提升吞吐量就是并行,保證數(shù)據(jù)不丟失只有備份冗余单芜,對(duì)大文件也只有分塊存儲(chǔ)蜕该。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市洲鸠,隨后出現(xiàn)的幾起案子堂淡,更是在濱河造成了極大的恐慌,老刑警劉巖扒腕,帶你破解...
    沈念sama閱讀 217,542評(píng)論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件绢淀,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡瘾腰,警方通過查閱死者的電腦和手機(jī)皆的,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,822評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)蹋盆,“玉大人费薄,你說我怎么就攤上這事硝全。” “怎么了楞抡?”我有些...
    開封第一講書人閱讀 163,912評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵伟众,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我拌倍,道長(zhǎng)赂鲤,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,449評(píng)論 1 293
  • 正文 為了忘掉前任柱恤,我火速辦了婚禮数初,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘梗顺。我一直安慰自己泡孩,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,500評(píng)論 6 392
  • 文/花漫 我一把揭開白布寺谤。 她就那樣靜靜地躺著仑鸥,像睡著了一般。 火紅的嫁衣襯著肌膚如雪变屁。 梳的紋絲不亂的頭發(fā)上眼俊,一...
    開封第一講書人閱讀 51,370評(píng)論 1 302
  • 那天,我揣著相機(jī)與錄音粟关,去河邊找鬼疮胖。 笑死,一個(gè)胖子當(dāng)著我的面吹牛闷板,可吹牛的內(nèi)容都是我干的澎灸。 我是一名探鬼主播,決...
    沈念sama閱讀 40,193評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼遮晚,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼性昭!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起县遣,我...
    開封第一講書人閱讀 39,074評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤糜颠,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后萧求,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體括蝠,經(jīng)...
    沈念sama閱讀 45,505評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,722評(píng)論 3 335
  • 正文 我和宋清朗相戀三年饭聚,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片搁拙。...
    茶點(diǎn)故事閱讀 39,841評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡秒梳,死狀恐怖法绵,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情酪碘,我是刑警寧澤朋譬,帶...
    沈念sama閱讀 35,569評(píng)論 5 345
  • 正文 年R本政府宣布,位于F島的核電站兴垦,受9級(jí)特大地震影響徙赢,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜探越,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,168評(píng)論 3 328
  • 文/蒙蒙 一狡赐、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧钦幔,春花似錦枕屉、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,783評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至卷玉,卻和暖如春哨颂,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背相种。 一陣腳步聲響...
    開封第一講書人閱讀 32,918評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工威恼, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人蚂子。 一個(gè)月前我還...
    沈念sama閱讀 47,962評(píng)論 2 370
  • 正文 我出身青樓沃测,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親食茎。 傳聞我的和親對(duì)象是個(gè)殘疾皇子蒂破,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,781評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容