HDFS-分布式文件系統(tǒng)

前言

  • 在大數(shù)據(jù)場(chǎng)景中,大量數(shù)據(jù)是以文件形式儲(chǔ)存的惋砂,典型的是行為日志數(shù)據(jù)(用戶(hù)搜索日志妒挎,購(gòu)買(mǎi)日志,點(diǎn)擊日志西饵,以及機(jī)器操作數(shù)據(jù)等)
  • 這些數(shù)據(jù)都很重要酝掩,則就必須滿(mǎn)足可擴(kuò)展,容錯(cuò)眷柔,易用等特點(diǎn)

背景

HDFS的出現(xiàn)主要解決一下問(wèn)題:

  • 容錯(cuò)性
    數(shù)據(jù)越來(lái)越大期虾,所以?xún)?chǔ)存的服務(wù)器就會(huì)原來(lái)越多,這就要求當(dāng)中一臺(tái)服務(wù)器異常不影響數(shù)據(jù)
  • 統(tǒng)一格式儲(chǔ)存
    數(shù)據(jù)的大小各不相同驯嘱,這就要求數(shù)據(jù)的保存要從新定義镶苞,(block 塊是一個(gè)很好的解決問(wèn)題)
  • 一次寫(xiě)入多次讀取
    有些數(shù)據(jù)(日志)只會(huì)寫(xiě)一次,多次讀取

分布式系統(tǒng)的存儲(chǔ)種類(lèi)

  • 文件級(jí)別的分布式系統(tǒng)
    存儲(chǔ)單位是文件
  • 塊級(jí)別的分布式系統(tǒng)
    存儲(chǔ)單位是將文件分為的等大小的塊

HDFS的基本架構(gòu)

hdfs 采用主從架構(gòu)(master-slave)

NameNode(主節(jié)點(diǎn))
  • hdfs的集群管理者鞠评,負(fù)責(zé)管理集群的元信息(維護(hù)整個(gè)文件的目錄結(jié)構(gòu)樹(shù)和數(shù)據(jù)塊信息)和管理datanode(通過(guò)心跳周期性的檢測(cè)DataNode的存活狀態(tài)

  • NameNode的相關(guān)問(wèn)題
    1茂蚓、單點(diǎn)故障:
    一個(gè)集群只有一個(gè)NameNode為之服務(wù),稱(chēng)為“active NameNode”,為了避免單點(diǎn)故障,可備用一臺(tái)備用機(jī)“standby NameNode”;
    2聋涨、主備切換:
    手動(dòng)模式:通過(guò)命令
    自動(dòng)模式:借助zookeeper
    3晾浴、狀態(tài)同步:
    借助第三方日志儲(chǔ)存系統(tǒng),activeNameNode將操作日志寫(xiě)入共享系統(tǒng)牍白,standby NameNode從共享系統(tǒng)中讀取出來(lái)

  • 拓展
    當(dāng)數(shù)據(jù)越來(lái)越大時(shí)脊凰,單個(gè)nameNode會(huì)成為數(shù)據(jù)傳輸?shù)钠款i,這是就需要對(duì)NameNode進(jìn)行分片茂腥,也就是可以允許多個(gè)NameNode 對(duì)集群進(jìn)行服務(wù)(當(dāng)然狸涌,也得考慮單點(diǎn)故障)

SecondNameNode(檢查點(diǎn)節(jié)點(diǎn))
  • 首先,它定時(shí)到NameNode去獲取edit logs最岗,并更新到fsimage上杈抢。
  • 一旦它有了新的fsimage文件,它將其拷貝回NameNode中仑性。
  • NameNode在下次重啟時(shí)會(huì)使用這個(gè)新的fsimage文件惶楼,從而減少重啟的時(shí)間。
DataNode(從節(jié)點(diǎn))
  • 儲(chǔ)存實(shí)際的數(shù)據(jù)塊诊杆,通過(guò)心跳即時(shí)匯報(bào)自己的狀態(tài)信息
Client(客戶(hù)端)
  • 用戶(hù)借助client來(lái)與nameNode 和 dataNode 進(jìn)行交互歼捐,完成各種操作
  • client 完成數(shù)據(jù)的分塊
  • client 向dataNode傳輸數(shù)據(jù)是流水線操作

Hdfs的容錯(cuò)

  • NameNode 異常
    前面已經(jīng)提到了nameNode 可設(shè)置主從配置
  • DataNode 服務(wù)器異常
    Hdfs的數(shù)據(jù)默認(rèn)是3副本,當(dāng)發(fā)現(xiàn)有數(shù)據(jù)異常晨汹,nameNode 可從新分配
  • 數(shù)據(jù)塊損壞
    NataNode在存儲(chǔ)數(shù)據(jù)的時(shí)候豹储,會(huì)相應(yīng)的生成一段隨機(jī)數(shù),當(dāng)讀取的時(shí)候發(fā)現(xiàn)隨機(jī)數(shù)不一致淘这,就認(rèn)為數(shù)據(jù)失效了

HDFS的副本放置策略

  • 客戶(hù)端與Datanode 同節(jié)點(diǎn)(第一個(gè)副本寫(xiě)在同節(jié)點(diǎn)的datanode上剥扣,另外兩個(gè)副本寫(xiě)在另一個(gè)相同機(jī)架的不同dataNode上)
  • 客戶(hù)端與NameNode 與dataNode 不同節(jié)點(diǎn),(第一個(gè)副本會(huì)隨機(jī)寫(xiě)在一個(gè)nataNode上铝穷,另外兩個(gè)寫(xiě)在另一個(gè)相同機(jī)架的不同節(jié)點(diǎn)上)

HDFS的異構(gòu)存儲(chǔ)介質(zhì)

  • hdfs 可支持多種儲(chǔ)存介質(zhì)(固態(tài)硬盤(pán)钠怯,內(nèi)存等)

集中式緩存管理

HDFS可通過(guò)命令或者api來(lái)管理集中式緩存系統(tǒng)中的文件和目錄,來(lái)提高效率

訪問(wèn)方式

  • shell
  • api
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末曙聂,一起剝皮案震驚了整個(gè)濱河市晦炊,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌宁脊,老刑警劉巖断国,帶你破解...
    沈念sama閱讀 218,386評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異榆苞,居然都是意外死亡稳衬,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,142評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門(mén)坐漏,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)薄疚,“玉大人弄砍,你說(shuō)我怎么就攤上這事∈涮椋” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,704評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵慨畸,是天一觀的道長(zhǎng)莱坎。 經(jīng)常有香客問(wèn)我,道長(zhǎng)寸士,這世上最難降的妖魔是什么檐什? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,702評(píng)論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮弱卡,結(jié)果婚禮上乃正,老公的妹妹穿的比我還像新娘。我一直安慰自己婶博,他們只是感情好瓮具,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,716評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著凡人,像睡著了一般名党。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上挠轴,一...
    開(kāi)封第一講書(shū)人閱讀 51,573評(píng)論 1 305
  • 那天传睹,我揣著相機(jī)與錄音,去河邊找鬼岸晦。 笑死欧啤,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的启上。 我是一名探鬼主播邢隧,決...
    沈念sama閱讀 40,314評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼冈在!你這毒婦竟也來(lái)了府框?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,230評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤讥邻,失蹤者是張志新(化名)和其女友劉穎迫靖,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體兴使,經(jīng)...
    沈念sama閱讀 45,680評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡系宜,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,873評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了发魄。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片盹牧。...
    茶點(diǎn)故事閱讀 39,991評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡俩垃,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出汰寓,到底是詐尸還是另有隱情口柳,我是刑警寧澤,帶...
    沈念sama閱讀 35,706評(píng)論 5 346
  • 正文 年R本政府宣布有滑,位于F島的核電站跃闹,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏毛好。R本人自食惡果不足惜望艺,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,329評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望肌访。 院中可真熱鬧找默,春花似錦、人聲如沸吼驶。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,910評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)蟹演。三九已至咧欣,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間轨帜,已是汗流浹背魄咕。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,038評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留蚌父,地道東北人哮兰。 一個(gè)月前我還...
    沈念sama閱讀 48,158評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像苟弛,于是被迫代替她去往敵國(guó)和親喝滞。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,941評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容