增加協(xié)調(diào)部門:協(xié)同部門可以實時收集各個倉庫的運作情況胧谈,并決策將進貨存放在哪里更為合適蒜田。
命名節(jié)點(Name Node)
在HDFS中杠袱,扮演這個角色的節(jié)點稱為命名節(jié)點(Name Node)赡茸,它維護著系統(tǒng)中的大量元數(shù)據(jù)审葬,負責管理文件系統(tǒng)的命名空間(Name Space)和控制外部的訪問森缠,包括打開拔鹰、關閉、重命名文件或目錄辅鲸,將數(shù)據(jù)塊映射到具體的數(shù)據(jù)節(jié)點等格郁。
次要命名節(jié)點(Secondary Name Node)。
隨著協(xié)同部門職能重要性的日益增加,總公司可能還會將其管理內(nèi)容進行備份例书,這就是次要命名節(jié)點(Secondary Name Node)锣尉。
次要命名節(jié)點和命名節(jié)點的區(qū)別在于,它不會與數(shù)據(jù)節(jié)點和其他任務節(jié)點溝通决采,也不接收HDFS上的任何變化記錄自沧。次要命名節(jié)點最主要的目標就是與命名節(jié)點通信,根據(jù)配置定期地獲取命名節(jié)點上的HDFS元數(shù)據(jù)快照树瞭,因此效率是非常高的拇厢。
數(shù)據(jù)節(jié)點 (Data Node)
在多個倉庫中進行備貨:意外總是會發(fā)生,為了防止意外導致缺貨的情況發(fā)生晒喷,可以采用的一項策略是將貨物存儲在多地的倉庫中孝偎。在HDFS中也有同樣的理念,這就是備份或副本(Replication)凉敲。存儲在數(shù)據(jù)節(jié)點上的數(shù)據(jù)庫可以有多個副本衣盾,并分發(fā)到其他節(jié)點上。這樣在某個數(shù)據(jù)節(jié)點上丟失的數(shù)據(jù)爷抓,可以在其他數(shù)據(jù)節(jié)點上找到并恢復势决。容錯性得以提升。通過這個案例的比喻蓝撇,也可以很容易地理解HDFS分布式文件系統(tǒng)一個重要的運用場景果复,就是與第2章中介紹的數(shù)據(jù)收集相互集成,保存互聯(lián)網(wǎng)和大型企業(yè)內(nèi)部每天產(chǎn)生的海量數(shù)據(jù)內(nèi)容渤昌。理解了這些基本的概念虽抄,我們就可以畫出圖3-2來展示HDFS的工作原理了。