HDFS(5)- 數(shù)據(jù)流之寫(xiě)入

根據(jù)下圖介紹HDFS的寫(xiě)入流程。

hdfs-write.png

步驟

1. create

客戶(hù)端通過(guò)對(duì)DistributedFileSystem對(duì)象調(diào)用create()方法來(lái)發(fā)起創(chuàng)建文件流程娶桦。

2. create

DistributedFileSystem對(duì)象對(duì)namenode創(chuàng)建一個(gè)RPC調(diào)用暮胧,在文件系統(tǒng)中的命名空間中創(chuàng)建一個(gè)文件,此時(shí)還沒(méi)有對(duì)此文件創(chuàng)建相應(yīng)的數(shù)據(jù)塊。namenode執(zhí)行各種檢查確保這個(gè)文件不存在以及客戶(hù)端有新建該文件的權(quán)限穴店。如果檢查通過(guò)namenode就會(huì)創(chuàng)建這個(gè)文件并添加一條記錄。否則拿穴,文件創(chuàng)建失敗并向客戶(hù)端拋出IOException異常泣洞。DistributedFileSystem對(duì)象向客戶(hù)端返回一個(gè)FSDataOutputStream對(duì)象。

3. write

客戶(hù)端獲得FSDataOutputStream對(duì)象后默色,開(kāi)始寫(xiě)入數(shù)據(jù)球凰。和讀取數(shù)據(jù)一樣FSDataOutputStream封裝了DFSOutputStream對(duì)象,該對(duì)象負(fù)責(zé)處理datanodenamenode之間的通訊腿宰。

4. write packet

DFSOutputStream將寫(xiě)入的數(shù)據(jù)分成一個(gè)個(gè)的數(shù)據(jù)包并寫(xiě)入內(nèi)部隊(duì)列呕诉,稱(chēng)為“數(shù)據(jù)隊(duì)列”。DataStreamer處理數(shù)據(jù)隊(duì)列吃度,它的挑選出一組合適存儲(chǔ)數(shù)據(jù)的datanode甩挫,namenode根據(jù)這些信息來(lái)分配新的數(shù)據(jù)塊。假設(shè)副本數(shù)為3规肴,則寫(xiě)入需要涉及3個(gè)datanode捶闸。DataStreamer將數(shù)據(jù)包流式寫(xiě)入第一個(gè)datanode中,并且第一個(gè)會(huì)將數(shù)據(jù)轉(zhuǎn)發(fā)給第二個(gè)datanode拖刃。同樣删壮,第二個(gè)也會(huì)將數(shù)據(jù)轉(zhuǎn)發(fā)給第三個(gè)datanode

5. ack packet

DFSOutputStream也維護(hù)著一個(gè)內(nèi)存數(shù)據(jù)包隊(duì)列來(lái)等待datanode收到數(shù)據(jù)的確認(rèn)回執(zhí)兑牡,稱(chēng)為“確認(rèn)隊(duì)列”央碟。收到所有datanode確認(rèn)信息后,該數(shù)據(jù)包才會(huì)從確認(rèn)隊(duì)列刪除。如果任何datanode寫(xiě)入數(shù)據(jù)中發(fā)生故障亿虽,則執(zhí)行以下操作菱涤。

  1. 關(guān)閉錯(cuò)誤的寫(xiě)入流。確認(rèn)把隊(duì)列中的所有數(shù)據(jù)包都添加回?cái)?shù)據(jù)隊(duì)列的最前端洛勉,等待重新發(fā)送粘秆,確保故障發(fā)生節(jié)點(diǎn)以后的datanode不會(huì)漏掉任何一個(gè)數(shù)據(jù)包。

  2. 當(dāng)前數(shù)據(jù)塊可能已經(jīng)正常寫(xiě)入一些節(jié)點(diǎn)收毫,則對(duì)這些數(shù)據(jù)塊指定一個(gè)新的標(biāo)識(shí)攻走,并將該表示傳遞給namenode,便于故障datanode可以刪除存儲(chǔ)的部分?jǐn)?shù)據(jù)塊此再。

  3. 刪除故障的datanode昔搂,選擇兩個(gè)正常的datanode構(gòu)建一條新的管線。余下的數(shù)據(jù)塊寫(xiě)入管線中正常的datanode输拇。namenode注意到塊副本量不足時(shí)摘符,會(huì)在另一個(gè)節(jié)點(diǎn)上創(chuàng)建一個(gè)新的副本。

6. close

客戶(hù)端完成數(shù)據(jù)的寫(xiě)入后策吠,對(duì)數(shù)據(jù)流調(diào)用close()方法逛裤。

7. complete

通知namenode所有文件寫(xiě)入完成后完成寫(xiě)入操作。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末奴曙,一起剝皮案震驚了整個(gè)濱河市别凹,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌洽糟,老刑警劉巖炉菲,帶你破解...
    沈念sama閱讀 217,826評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異坤溃,居然都是意外死亡拍霜,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,968評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)薪介,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)祠饺,“玉大人,你說(shuō)我怎么就攤上這事汁政〉劳担” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,234評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵记劈,是天一觀的道長(zhǎng)勺鸦。 經(jīng)常有香客問(wèn)我,道長(zhǎng)目木,這世上最難降的妖魔是什么换途? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,562評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上军拟,老公的妹妹穿的比我還像新娘剃执。我一直安慰自己,他們只是感情好懈息,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,611評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布肾档。 她就那樣靜靜地躺著,像睡著了一般辫继。 火紅的嫁衣襯著肌膚如雪阁最。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,482評(píng)論 1 302
  • 那天骇两,我揣著相機(jī)與錄音,去河邊找鬼姜盈。 笑死低千,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的馏颂。 我是一名探鬼主播示血,決...
    沈念sama閱讀 40,271評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼救拉!你這毒婦竟也來(lái)了难审?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,166評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤亿絮,失蹤者是張志新(化名)和其女友劉穎告喊,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體派昧,經(jīng)...
    沈念sama閱讀 45,608評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡黔姜,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,814評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了蒂萎。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片秆吵。...
    茶點(diǎn)故事閱讀 39,926評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖五慈,靈堂內(nèi)的尸體忽然破棺而出纳寂,到底是詐尸還是另有隱情,我是刑警寧澤泻拦,帶...
    沈念sama閱讀 35,644評(píng)論 5 346
  • 正文 年R本政府宣布毙芜,位于F島的核電站,受9級(jí)特大地震影響聪轿,放射性物質(zhì)發(fā)生泄漏爷肝。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,249評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望灯抛。 院中可真熱鬧金赦,春花似錦、人聲如沸对嚼。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,866評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)纵竖。三九已至漠烧,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間靡砌,已是汗流浹背已脓。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,991評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留通殃,地道東北人度液。 一個(gè)月前我還...
    沈念sama閱讀 48,063評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像画舌,于是被迫代替她去往敵國(guó)和親堕担。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,871評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 認(rèn)識(shí)HDFS HDFS的特點(diǎn): 高容錯(cuò)性高吞吐量故障的檢測(cè)和自動(dòng)快速恢復(fù)流式的數(shù)據(jù)訪問(wèn)大數(shù)據(jù)集一次寫(xiě)入,多次讀寫(xiě) ...
    Bloo_m閱讀 3,262評(píng)論 6 8
  • hadoop HDFS原理解析01 HDFS架構(gòu)?NameNode?DataNode?Sencondary Nam...
    白菜青蘿卜閱讀 2,723評(píng)論 2 30
  • 思考問(wèn)題 HDFS的架構(gòu) 設(shè)計(jì)前提和目標(biāo) 專(zhuān)為存儲(chǔ)超大文件而設(shè)計(jì):hdfs應(yīng)該能夠支持GB級(jí)別大小的文件曲聂;它應(yīng)該能...
    Sakura_P閱讀 637評(píng)論 0 2
  • 文I大之 01 原文: 我的媽媽 我的媽媽既聰明又漂亮。 她的個(gè)子在女生中算高的了旭咽,一雙大眼剂碴,眉毛較濃,五官整齊轻专。...
    大之閱讀 340評(píng)論 0 0
  • 承認(rèn)吧忆矛,有時(shí)候你真的懷疑自己得選擇。
    獼猴桃的桃閱讀 137評(píng)論 0 0