我認為的HDFS(一)

???? HDFS是Hadoop家族成員之一什黑，Hadoop還包括hive 盛嘿，hbase 削锰，zombie,mapreduce等妹卿。

首先介紹一下hdfs:

??????????????????????????? 全稱是?? Hadoop distributed file system, 中文稱? “分布式文件系統(tǒng)”

????????????????????????????其特點：高容錯性熄求，保證了數據不易丟失渣玲，維護數據的完整性。

??????????????????????????? 適用對象：適用于大規(guī)模數據集弟晚。

?????????????????????????? hdfs被設計成適合批量處理的忘衍，而不是交互式，重點在數據的吞吐量卿城。

?????????????????????????? hdfs是主從結構枚钓，即一個主節(jié)點（namenode）和多個從節(jié)點（datanode）.

既然是分布式文件系統(tǒng)，當然是為了存儲文件而生瑟押，文件是由數據組成的秘噪，也可以理解成元數據+文件類容。

namenode:

?????????????? 1.用來存儲文件的元數據（即文件的文件名勉耀，文件大小指煎，建立文件的日期，路徑等文件屬性）

???????????????2便斥，元數據保存在內存中至壤。

???????????????3，保存文件block枢纠，datanode之間的映射關系像街。

datanode:

??????????????? 1.存儲文件類容

??????????????? 2.文件保存在硬盤中

???????????????3. 維護了block id 到datanode本地文件的映射關系。

HDFS運行機制：

1.一個名字節(jié)點和多個數據節(jié)點晋渺。

2.數據復制（數據復制镰绎，保證數據完整性，不易丟失）木西。

3.存放位置畴栖，即不能部署在一個機架上，至少要兩個機架八千。

故障檢測：

1.心跳包檢測（檢測是否宕機）吗讶。

2燎猛，塊報告（安全模式下檢測）。

3.數據完整性檢測（檢驗比較）照皆。

HDFS數據存儲單元（block）：

1.數據的存儲單元是block

2.默認是64MB

3.大小不到64MB重绷，可單獨存儲一個block。

文件存儲方法：

1.按照大小被切分成若干個block存儲在不同的節(jié)點上膜毁。

2.默認情況下昭卓，每個block都有三個副本。

注意事項：block大小和副本數通過client編譯上傳文件設置瘟滨，文件上傳成功后候醒，副本數可以變更，大小是不可以變更的室奏。

HDFS寫數據流程：

客戶端要向hdfs寫數據火焰，首先要跟namenode通信，以確認可以寫文件并獲得接受文件block的datanode胧沫，然后昌简，客戶端按順尋將文件著個block傳遞給相應的datanode，并由接收到的block的datanode負責向其他的data復制block的副本绒怨。如圖所示

HDFS讀數據流程：

????? 客戶端將要讀取的數據的路徑發(fā)送給namenode,namenode獲取文件的元信息主要是block的存放位置信息纯赎，返回給客戶端，根據返回的信息找到相應的datanode逐個獲取文件的block并在客戶端本地進行數據分析合并從而獲得整個文件南蹂。如圖所示

讀文件流程

體會：

???????????? 寫文件流程就是說犬金；把大規(guī)模數據導入到搭建的分布式文件系統(tǒng)中去，首先要請求人家六剥，不請求是不禮貌的晚顷，請求完后，人家在檢測一下疗疟，這里檢查是元數據该默，萬一，你的數據出錯呢策彤，完事后栓袖，人家會給你個消息，告訴你導入的文件放在哪里店诗，不能隨便放置裹刮，要根據block的地址來存放這些文件，因為存放文件類容的datanode有很多庞瘸，所以datanode之間也要建立聯(lián)系捧弃，到這里已經規(guī)定了，block的數量和大小恕洲，這些工作準備好后就可以把文件寫到分布式系統(tǒng)中去了塔橡。

?????????? 讀文件流程就是：把已經寫好的文件取出來梅割，首先你要知道存放文件的路徑霜第，而路徑存放在namenode中葛家，然后，namenode把路徑信息返回給client泌类，而后client根據返回的路徑信息去找到datanode中的文件類容癞谒，并在客戶端加以分析獲得整個文件。

HDFS設計思想：

設計思想

總的來說刃榨，hdfs 就是一個存儲大量數據文件的文件系統(tǒng)弹砚，hdfs包含這三個主要成員（client，namenode,datanode）,client 負責發(fā)送請求枢希，接收反饋的信息桌吃，namenode負責存放元數據，datanode負責存放文件類容苞轿。前者存放在內存中茅诱，后者存放在硬盤里。

???

存放模式

?????????? 可以舉個栗子來說明搬卒，在沒有這個技術之前瑟俭，數據都是存放在一臺機子上，當有大量的數據要讀寫時要花費漫長的時間契邀，比如有100TB的數據摆寄，放在一臺機子上要讀半天的時間，但是有這個技術之后坯门，數據可以存放在很多機子上微饥，比如存放在1000臺機子上，平均下來古戴，每臺機子才存放0.1TB的數據欠橘，在讀數據的時候讓1000臺機子同時工作，這樣可以大大節(jié)省時間允瞧，可能一個半小時就OK了简软。如果嫌這個栗子不好吃，在說個好吃的述暂，假如痹升，在大海里有一頭鯨魚快樂的玩耍，然而畦韭，有一條餓瘋了的大白鯊看到這個鮮美的鯨魚疼蛾，就上去開吃，大白鯊得用多長的時間才能夠把這頭鯨魚吃完艺配，即使吃完察郁，這條大白鯊還能像以前那樣毫發(fā)無損嗎衍慎？但是，大白鯊換成食人魚呢皮钠！稳捆，不要問我大海里哪來的食人魚，我這是舉個栗子麦轰，全世界的食人魚一起來吃這個鯨魚乔夯，你一口，我一口款侵，他一口末荐，你一口，我一口新锈，他一口甲脏，。妹笆。块请。。晾浴。负乡。。脊凰。抖棘。“臥槽我來晚了狸涌，我沒吃到切省，你們都吃完了”最后一個到達吃貨現(xiàn)場的食人魚說到∨恋ǎ“我們還沒吃飽呢朝捆，在找找還有沒有其他鯨魚”其他的食人魚答道。

這就是hdfs的優(yōu)勢懒豹，雖然單個存儲數據不如大型機子芙盘，但是當多個機子聯(lián)合起來就是王者

最后編輯于：2017.12.04 03:06:47

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市脸秽，隨后出現(xiàn)的幾起案子儒老，更是在濱河造成了極大的恐慌，老刑警劉巖记餐，帶你破解...
沈念sama閱讀 212,542評論 6贊 493
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件驮樊，死亡現(xiàn)場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機囚衔，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,596評論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門挖腰，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人练湿，你說我怎么就攤上這事猴仑。” “怎么了鞠鲜？”我有些...
開封第一講書人閱讀 158,021評論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵宁脊，是天一觀的道長断国。經常有香客問我贤姆，道長，這世上最難降的妖魔是什么稳衬？我笑而不...
開封第一講書人閱讀 56,682評論 1贊 284
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上歇僧，老公的妹妹穿的比我還像新娘麻蹋。我一直安慰自己，他們只是感情好街夭，可當我...
茶點故事閱讀 65,792評論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布砰碴。她就那樣靜靜地躺著，像睡著了一般板丽。火紅的嫁衣襯著肌膚如雪呈枉。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 49,985評論 1贊 291
城市分裂傳說
那天埃碱，我揣著相機與錄音猖辫，去河邊找鬼。笑死砚殿，一個胖子當著我的面吹牛啃憎，可吹牛的內容都是我干的。我是一名探鬼主播似炎，決...
沈念sama閱讀 39,107評論 3贊 410
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼辛萍，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了羡藐？” 一聲冷哼從身側響起贩毕，我...
開封第一講書人閱讀 37,845評論 0贊 268
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎传睹，沒想到半個月后耳幢，有當地人在樹林里發(fā)現(xiàn)了一具尸體，經...
沈念sama閱讀 44,299評論 1贊 303
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 36,612評論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年睛藻，在試婚紗的時候發(fā)現(xiàn)自己被綠了启上。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 38,747評論 1贊 341
活死人
序言：一個原本活蹦亂跳的男人離奇死亡店印，死狀恐怖冈在，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情按摘，我是刑警寧澤包券，帶...
沈念sama閱讀 34,441評論 4贊 333
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站炫贤，受9級特大地震影響溅固，放射性物質發(fā)生泄漏。R本人自食惡果不足惜兰珍，卻給世界環(huán)境...
茶點故事閱讀 40,072評論 3贊 317
男人毒藥：我在死后第九天來索命
文/蒙蒙一侍郭、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧掠河，春花似錦亮元、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,828評論 0贊 21
一樁弒父案爆捞，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至勾拉，卻和暖如春煮甥，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背望艺。一陣腳步聲響...
開封第一講書人閱讀 32,069評論 1贊 267
情欲美人皮
我被黑心中介騙來泰國打工苛秕，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人找默。一個月前我還...
沈念sama閱讀 46,545評論 2贊 362
代替公主和親
正文我出身青樓艇劫，卻偏偏與公主長得像，于是被迫代替她去往敵國和親惩激。傳聞我的和親對象是個殘疾皇子店煞，可洞房花燭夜當晚...
茶點故事閱讀 43,658評論 2贊 350