Hadoop hdfs

增加協(xié)調(diào)部門：協(xié)同部門可以實時收集各個倉庫的運作情況胧谈，并決策將進貨存放在哪里更為合適蒜田。

命名節(jié)點（Name Node）

在HDFS中杠袱，扮演這個角色的節(jié)點稱為命名節(jié)點（Name Node）赡茸，它維護著系統(tǒng)中的大量元數(shù)據(jù)审葬，負責管理文件系統(tǒng)的命名空間（Name Space）和控制外部的訪問森缠，包括打開拔鹰、關閉、重命名文件或目錄辅鲸，將數(shù)據(jù)塊映射到具體的數(shù)據(jù)節(jié)點等格郁。

次要命名節(jié)點（Secondary Name Node）。

隨著協(xié)同部門職能重要性的日益增加，總公司可能還會將其管理內(nèi)容進行備份例书，這就是次要命名節(jié)點（Secondary Name Node）锣尉。

次要命名節(jié)點和命名節(jié)點的區(qū)別在于，它不會與數(shù)據(jù)節(jié)點和其他任務節(jié)點溝通决采，也不接收HDFS上的任何變化記錄自沧。次要命名節(jié)點最主要的目標就是與命名節(jié)點通信，根據(jù)配置定期地獲取命名節(jié)點上的HDFS元數(shù)據(jù)快照树瞭，因此效率是非常高的拇厢。

數(shù)據(jù)節(jié)點 (Data Node)

在多個倉庫中進行備貨：意外總是會發(fā)生，為了防止意外導致缺貨的情況發(fā)生晒喷，可以采用的一項策略是將貨物存儲在多地的倉庫中孝偎。在HDFS中也有同樣的理念，這就是備份或副本（Replication）凉敲。存儲在數(shù)據(jù)節(jié)點上的數(shù)據(jù)庫可以有多個副本衣盾，并分發(fā)到其他節(jié)點上。這樣在某個數(shù)據(jù)節(jié)點上丟失的數(shù)據(jù)爷抓，可以在其他數(shù)據(jù)節(jié)點上找到并恢復势决。容錯性得以提升。通過這個案例的比喻蓝撇，也可以很容易地理解HDFS分布式文件系統(tǒng)一個重要的運用場景果复，就是與第2章中介紹的數(shù)據(jù)收集相互集成，保存互聯(lián)網(wǎng)和大型企業(yè)內(nèi)部每天產(chǎn)生的海量數(shù)據(jù)內(nèi)容渤昌。理解了這些基本的概念虽抄，我們就可以畫出圖3-2來展示HDFS的工作原理了。

image.png

最后編輯于：2020.05.23 10:49:28

?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者