HDFS(1)- 設(shè)計

HDFS的設(shè)計

我們從以下角度分析:

  • 超大文件

    HDFS可以并適合存儲超大文件俊抵。這里只具有幾百MB、幾百GB、甚至幾百TB大小的文件锌订。目前已經(jīng)有存儲PB級數(shù)據(jù)的Hadoop集群了眨业。

  • 流式數(shù)據(jù)訪問

    HDFS的設(shè)計理念:一次寫入急膀、多次讀取是最高效的訪問方式。數(shù)據(jù)集寫入后龄捡,每次分析都將涉及該數(shù)據(jù)集的大部分甚至全部卓嫂,因此在HDFS的設(shè)計中讀取整個數(shù)據(jù)集的時間延遲比讀取第一條記錄的時間延遲更重要。

  • 商用硬件

    HDFS并不需要運行在昂貴且可靠的硬件上聘殖。它是設(shè)計并運行在普通商用硬件的集群上的晨雳。同樣也帶來了問題,至少對于龐大的集群來說奸腺,節(jié)點故障的幾率還是比較高的餐禁。但是HDFS的高可用機制和容錯機制,可以讓集群繼續(xù)運行突照,并且不讓用戶察覺到明顯的中斷帮非。

  • 低時間延遲的數(shù)據(jù)訪問

    對低時間延遲要求較高的應(yīng)用,不適合在HDFS上運行绷旗。HDFS是為高數(shù)據(jù)吞吐量應(yīng)用優(yōu)化的喜鼓。為了實現(xiàn)這個目的副砍,提高時間延遲也是代價的一部分。對于低延遲的應(yīng)用HBase應(yīng)該是不錯的選擇庄岖。

  • 大量小文件

    由于namenode將文件系統(tǒng)的元數(shù)據(jù)存儲在內(nèi)存中豁翎,因此文件系統(tǒng)所能存儲的文件總數(shù)受限于namenode的內(nèi)存大小。如果每個文件的元數(shù)據(jù)大小為150字節(jié)隅忿,那么存儲一百萬個文件心剥,至少要300MB的內(nèi)存”惩可想而知优烧,如果有更多文件將會怎樣。

  • 多用戶寫入链峭,任意修改文件

    HDFS的文件僅支持單個寫入者畦娄,寫操作只能是以在文件末尾追加的方式。不支持隨機讀寫弊仪。

總結(jié)

從以上角度我們大概就能清楚的認識到HDFS的適用場景是怎樣的熙卡,我們在設(shè)計或部署HDFS集群時應(yīng)該考慮哪些問題。比如:并不是僅僅盲目的增加機器數(shù)據(jù)量励饵,就能完美擴容的驳癌。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市役听,隨后出現(xiàn)的幾起案子颓鲜,更是在濱河造成了極大的恐慌,老刑警劉巖典予,帶你破解...
    沈念sama閱讀 217,734評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件甜滨,死亡現(xiàn)場離奇詭異,居然都是意外死亡熙参,警方通過查閱死者的電腦和手機艳吠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評論 3 394
  • 文/潘曉璐 我一進店門麦备,熙熙樓的掌柜王于貴愁眉苦臉地迎上來孽椰,“玉大人,你說我怎么就攤上這事凛篙∈蜇遥” “怎么了?”我有些...
    開封第一講書人閱讀 164,133評論 0 354
  • 文/不壞的土叔 我叫張陵呛梆,是天一觀的道長锐涯。 經(jīng)常有香客問我,道長填物,這世上最難降的妖魔是什么纹腌? 我笑而不...
    開封第一講書人閱讀 58,532評論 1 293
  • 正文 為了忘掉前任霎终,我火速辦了婚禮,結(jié)果婚禮上升薯,老公的妹妹穿的比我還像新娘莱褒。我一直安慰自己,他們只是感情好明未,可當(dāng)我...
    茶點故事閱讀 67,585評論 6 392
  • 文/花漫 我一把揭開白布匣缘。 她就那樣靜靜地躺著罚攀,像睡著了一般。 火紅的嫁衣襯著肌膚如雪谅海。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,462評論 1 302
  • 那天蹦浦,我揣著相機與錄音扭吁,去河邊找鬼。 笑死盲镶,一個胖子當(dāng)著我的面吹牛智末,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播徒河,決...
    沈念sama閱讀 40,262評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼系馆,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了顽照?” 一聲冷哼從身側(cè)響起由蘑,我...
    開封第一講書人閱讀 39,153評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎代兵,沒想到半個月后尼酿,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,587評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡植影,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,792評論 3 336
  • 正文 我和宋清朗相戀三年裳擎,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片思币。...
    茶點故事閱讀 39,919評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡鹿响,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出谷饿,到底是詐尸還是另有隱情惶我,我是刑警寧澤,帶...
    沈念sama閱讀 35,635評論 5 345
  • 正文 年R本政府宣布博投,位于F島的核電站绸贡,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜听怕,卻給世界環(huán)境...
    茶點故事閱讀 41,237評論 3 329
  • 文/蒙蒙 一捧挺、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧尿瞭,春花似錦松忍、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,855評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至酥艳,卻和暖如春摊溶,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背充石。 一陣腳步聲響...
    開封第一講書人閱讀 32,983評論 1 269
  • 我被黑心中介騙來泰國打工莫换, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人骤铃。 一個月前我還...
    沈念sama閱讀 48,048評論 3 370
  • 正文 我出身青樓拉岁,卻偏偏與公主長得像,于是被迫代替她去往敵國和親惰爬。 傳聞我的和親對象是個殘疾皇子喊暖,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,864評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 首先,我們在使用前先看看HDFS是什麼撕瞧?這將有助于我們是以后的運維使用和故障排除思路的獲得陵叽。 HDFS采用mast...
    W_Bousquet閱讀 4,196評論 0 2
  • HDFS的設(shè)計目標 通過上一篇文章的介紹我們已經(jīng)了解到HDFS到底是怎樣的東西,以及它是怎樣通過多副本機制來提供高...
    陌上疏影涼閱讀 1,446評論 0 3
  • 一丛版、Hadoop Hadoop是Apache開源的大數(shù)據(jù)存儲及分析的工具巩掺。 數(shù)據(jù)存儲以自帶的旗艦級分布式文件系統(tǒng)H...
    Mervey閱讀 770評論 0 0
  • 不見碣石,只見滄海页畦,登高而望胖替,永無盡時天涯明月未有變,滄海桑田人不知 漢唐西京豫缨,明清北都独令,多少血淚,筆畫如刀 君不...
    24e2f6668318閱讀 266評論 0 0
  • Legendshop帶你玩轉(zhuǎn)互聯(lián)網(wǎng)+小賣部 去年推出的“零售通”一站式進貨平臺州胳,為社區(qū)零售店提供訂貨记焊、物流逸月、營銷和...
    朗尊先生閱讀 605評論 0 0