我認為的HDFS(一)

???? HDFS是Hadoop家族成員之一什黑,Hadoop還包括hive 盛嘿,hbase 削锰,zombie,mapreduce等妹卿。

首先介紹一下hdfs:

??????????????????????????? 全稱是?? Hadoop distributed file system, 中文稱? “分布式文件系統(tǒng)”

????????????????????????????其特點:高容錯性熄求,保證了數據不易丟失渣玲,維護數據的完整性。

??????????????????????????? 適用對象:適用于大規(guī)模數據集弟晚。

?????????????????????????? hdfs被設計成適合批量處理的忘衍,而不是交互式,重點在數據的吞吐量卿城。

?????????????????????????? hdfs是主從結構枚钓,即一個主節(jié)點(namenode)和多個從節(jié)點(datanode).

既然是分布式文件系統(tǒng),當然是為了存儲文件而生瑟押,文件是由數據組成的秘噪,也可以理解成元數據+文件類容。

namenode:

?????????????? 1.用來存儲文件的元數據(即文件的文件名勉耀,文件大小指煎,建立文件的日期,路徑等文件屬性)

???????????????2便斥,元數據保存在內存中至壤。

???????????????3,保存文件block枢纠,datanode之間的映射關系像街。

datanode:

??????????????? 1.存儲文件類容

??????????????? 2.文件保存在硬盤中

???????????????3. 維護了block id 到datanode本地文件的映射關系。

HDFS運行機制:

1.一個名字節(jié)點和多個數據節(jié)點晋渺。

2.數據復制(數據復制镰绎,保證數據完整性,不易丟失)木西。

3.存放位置畴栖,即不能部署在一個機架上,至少要兩個機架八千。

故障檢測:

1.心跳包檢測(檢測是否宕機)吗讶。

2燎猛,塊報告(安全模式下檢測)。

3.數據完整性檢測(檢驗比較)照皆。

HDFS數據存儲單元(block):

1.數據的存儲單元是block

2.默認是64MB

3.大小不到64MB重绷,可單獨存儲一個block。

文件存儲方法:

1.按照大小被切分成若干個block存儲在不同的節(jié)點上膜毁。

2.默認情況下昭卓,每個block都有三個副本。

注意事項:block大小和副本數通過client編譯上傳文件設置瘟滨,文件上傳成功后候醒,副本數可以變更,大小是不可以變更的室奏。


HDFS寫數據流程:

客戶端要向hdfs寫數據火焰,首先要跟namenode通信,以確認可以寫文件并獲得接受文件block的datanode胧沫,然后昌简,客戶端按順尋將文件著個block傳遞給相應的datanode,并由接收到的block的datanode負責向其他的data復制block的副本绒怨。如圖所示


HDFS讀數據流程:

????? 客戶端將要讀取的數據的路徑發(fā)送給namenode,namenode獲取文件的元信息主要是block的存放位置信息纯赎,返回給客戶端,根據返回的信息找到相應的datanode逐個獲取文件的block并在客戶端本地進行數據分析合并從而獲得整個文件南蹂。如圖所示

讀文件流程

體會:

???????????? 寫文件流程就是說犬金;把大規(guī)模數據導入到搭建的分布式文件系統(tǒng)中去,首先要請求人家六剥,不請求是不禮貌的晚顷,請求完后,人家在檢測一下疗疟,這里檢查是元數據该默,萬一,你的數據出錯呢策彤,完事后栓袖,人家會給你個消息,告訴你導入的文件放在哪里店诗,不能隨便放置裹刮,要根據block的地址來存放這些文件,因為存放文件類容的datanode有很多庞瘸,所以datanode之間也要建立聯(lián)系捧弃,到這里已經規(guī)定了,block的數量和大小恕洲,這些工作準備好后就可以把文件寫到分布式系統(tǒng)中去了塔橡。

?????????? 讀文件流程就是:把已經寫好的文件取出來梅割,首先你要知道存放文件的路徑霜第,而路徑存放在namenode中葛家,然后,namenode把路徑信息返回給client泌类,而后client根據返回的路徑信息去找到datanode中的文件類容癞谒,并在客戶端加以分析獲得整個文件。


HDFS設計思想:

設計思想




總的來說刃榨,hdfs 就是一個存儲大量數據文件的文件系統(tǒng)弹砚,hdfs包含這三個主要成員(client,namenode,datanode),client 負責發(fā)送請求枢希,接收反饋的信息桌吃,namenode負責存放元數據,datanode負責存放文件類容苞轿。前者存放在內存中茅诱,后者存放在硬盤里。


???

存放模式

?????????? 可以舉個栗子來說明搬卒,在沒有這個技術之前瑟俭,數據都是存放在一臺機子上,當有大量的數據要讀寫時要花費漫長的時間契邀,比如有100TB的數據摆寄,放在一臺機子上要讀半天的時間,但是有這個技術之后坯门,數據可以存放在很多機子上微饥,比如存放在1000臺機子上,平均下來古戴,每臺機子才存放0.1TB的數據欠橘,在讀數據的時候讓1000臺機子同時工作,這樣可以大大節(jié)省時間允瞧,可能一個半小時就OK了简软。如果嫌這個栗子不好吃,在說個好吃的述暂,假如痹升,在大海里有一頭鯨魚快樂的玩耍,然而畦韭,有一條餓瘋了的大白鯊看到這個鮮美的鯨魚疼蛾,就上去開吃,大白鯊得用多長的時間才能夠把這頭鯨魚吃完艺配,即使吃完察郁,這條大白鯊還能像以前那樣毫發(fā)無損嗎衍慎? 但是,大白鯊換成食人魚呢皮钠!稳捆,不要問我大海里哪來的食人魚,我這是舉個栗子麦轰,全世界的食人魚一起來吃這個鯨魚乔夯,你一口,我一口款侵,他一口末荐,你一口,我一口新锈,他一口甲脏,。妹笆。块请。。晾浴。负乡。。脊凰。抖棘。“臥槽 我來晚了狸涌,我沒吃到切省,你們都吃完了”最后一個到達吃貨現(xiàn)場的食人魚說到∨恋ǎ“我們還沒吃飽呢朝捆,在找找還有沒有其他鯨魚”其他的食人魚答道。

這就是hdfs的優(yōu)勢懒豹,雖然單個存儲數據不如大型機子芙盘,但是當多個機子聯(lián)合起來就是王者











最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市脸秽,隨后出現(xiàn)的幾起案子儒老,更是在濱河造成了極大的恐慌,老刑警劉巖记餐,帶你破解...
    沈念sama閱讀 212,542評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件驮樊,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機囚衔,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,596評論 3 385
  • 文/潘曉璐 我一進店門挖腰,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人练湿,你說我怎么就攤上這事猴仑。” “怎么了鞠鲜?”我有些...
    開封第一講書人閱讀 158,021評論 0 348
  • 文/不壞的土叔 我叫張陵宁脊,是天一觀的道長断国。 經常有香客問我贤姆,道長,這世上最難降的妖魔是什么稳衬? 我笑而不...
    開封第一講書人閱讀 56,682評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上歇僧,老公的妹妹穿的比我還像新娘麻蹋。我一直安慰自己,他們只是感情好街夭,可當我...
    茶點故事閱讀 65,792評論 6 386
  • 文/花漫 我一把揭開白布砰碴。 她就那樣靜靜地躺著,像睡著了一般板丽。 火紅的嫁衣襯著肌膚如雪呈枉。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,985評論 1 291
  • 那天埃碱,我揣著相機與錄音猖辫,去河邊找鬼。 笑死砚殿,一個胖子當著我的面吹牛啃憎,可吹牛的內容都是我干的。 我是一名探鬼主播似炎,決...
    沈念sama閱讀 39,107評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼辛萍,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了羡藐?” 一聲冷哼從身側響起贩毕,我...
    開封第一講書人閱讀 37,845評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎传睹,沒想到半個月后耳幢,有當地人在樹林里發(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 44,299評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,612評論 2 327
  • 正文 我和宋清朗相戀三年睛藻,在試婚紗的時候發(fā)現(xiàn)自己被綠了启上。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,747評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡店印,死狀恐怖冈在,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情按摘,我是刑警寧澤包券,帶...
    沈念sama閱讀 34,441評論 4 333
  • 正文 年R本政府宣布,位于F島的核電站炫贤,受9級特大地震影響溅固,放射性物質發(fā)生泄漏。R本人自食惡果不足惜兰珍,卻給世界環(huán)境...
    茶點故事閱讀 40,072評論 3 317
  • 文/蒙蒙 一侍郭、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧掠河,春花似錦亮元、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,828評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至勾拉,卻和暖如春煮甥,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背望艺。 一陣腳步聲響...
    開封第一講書人閱讀 32,069評論 1 267
  • 我被黑心中介騙來泰國打工苛秕, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人找默。 一個月前我還...
    沈念sama閱讀 46,545評論 2 362
  • 正文 我出身青樓艇劫,卻偏偏與公主長得像,于是被迫代替她去往敵國和親惩激。 傳聞我的和親對象是個殘疾皇子店煞,可洞房花燭夜當晚...
    茶點故事閱讀 43,658評論 2 350

推薦閱讀更多精彩內容