Hadoop配置

Hadoop的配置文件被拆分為core-site.xml hdfs-site.xml mapred-site.xml
其中的core-site.xml hdfs-site.xml是站在HDFS角度上的配置文件;core-site.xml mapred-site.xml是站在MapReduce角度上的配置文件拍霜。

HDFS 的設(shè)計前提與目標
1 硬件錯誤是常態(tài)而不是異常
2 流式數(shù)據(jù)訪問, 運行在HDFS的應用主要是以流式數(shù)據(jù)讀取為主惫企, 做批量處理而不是用戶交互處理。 因此HDFS更關(guān)注數(shù)據(jù)訪問的高吞吐量夕土。
3大規(guī)模數(shù)據(jù)集筒愚。HDFS的典型文件大小可能在GB甚至TB級別蚜退,因此HDFS支持大文件存儲,并提供整體上高的數(shù)據(jù)傳輸帶寬牡肉,能在一個集群里擴展數(shù)百個結(jié)點捧灰。
4簡單一致性模型⊥炒福 HDFS的應用程序要對文件實行一次性寫毛俏,多次讀的訪問模式。
5 移動計算比移動數(shù)據(jù)更劃算饲窿。對于大文件來說煌寇,如果在數(shù)據(jù)旁操作,那么效率會比較高逾雄》埽 特別是數(shù)據(jù)非常大的時候效果更加明顯,可以減少網(wǎng)絡(luò)的擁塞和提高系統(tǒng)的吞吐量嘲驾。這就意味著淌哟,把計算遷移到數(shù)據(jù)的附近更好。而不是把數(shù)據(jù)傳輸?shù)匠绦蜻\行的地方辽故。
HDFS是一個主從體系徒仓,集群擁有一個NameNode和一些DataNodes。NameNode管理文件系統(tǒng)的元數(shù)據(jù)誊垢。DataNode存儲實際的數(shù)據(jù)掉弛≈⒓客戶端通過與NameNode和DataNode交互訪問文件系統(tǒng)。聯(lián)系NameNode獲得文件的元數(shù)據(jù)殃饿, 真正的IO操作直接和DataNode來交互的谋作。

HDFS的文件通常是按照64MB切分成不同的數(shù)據(jù)塊(Block), 每個數(shù)據(jù)塊盡可能的分散存儲于不同的DataNode中


image.png

NameNode使用事務(wù)日志(EditLog)來記錄HDFS元數(shù)據(jù)的變化乎芳,使用映象文件(FsImage)存儲文件系統(tǒng)的命名空間遵蚜,包含文件的映射,屬性等奈惑。日志和映象文件都存儲在NameNode的本地文件系統(tǒng)中吭净。
NameNode啟動時,從磁盤中讀取映象文件和事務(wù)日志肴甸,把事務(wù)日志的事務(wù)都應用到內(nèi)存的映象文件中寂殉。然后將新的元數(shù)據(jù)刷新到本地磁盤的新的映象文件中,這樣可以截去舊的事務(wù)日志原在,這個過程稱為檢查點(Checkpoint)友扰。HDFS還設(shè)有SecondaryNameNode節(jié)點,它輔助NameNode處理映象文件和事務(wù)日志庶柿。NameNode啟動的時候合并映象文件和事務(wù)日志村怪,而Secondary NameNode會周期性的從NameNode上復制映象文件和事務(wù)日志到臨時目錄。合并生成新的文件再重新上傳到NameNode澳泵。NameNode更新映象文件并清理事務(wù)日志实愚。控制事務(wù)日志的大小兔辅。

HDFS可靠性措施
1 冗余備份
2 副本存放
3 心跳檢測
4 安全模式
5 數(shù)據(jù)完整性檢測
6 空間回收
7 元數(shù)據(jù)磁盤失效 映象文件和事務(wù)日志是HDFS的核心數(shù)據(jù)結(jié)構(gòu),如果這些文件損壞击喂,將導致HDFS不可用维苔。NameNode可以配置為支持維護映象文件和事務(wù)日志的多個副本,任何改動將同步到它們的副本中
8 快照//目前還不支持

HDFS下的文件操作
1列出HDFS文件
hdfs dfs -ls
要注意在HDFS中沒有當前工作目錄著一個概念懂昂,也沒有cd這個命令介时。
2 列出HDFS目錄下某個文檔中的文件
hdfs dfs -ls in
ls -文件命瀏覽HDFS的某個文件
3 上傳文件到HDFS
hdfs dfs -put test1 test
將當前目錄下的test1文件上傳到HDFS并重命名為test
4將HDFS中的文件復制到本地系統(tǒng)中 
hadoop dfs -get in getin
5 刪除,通過-rmr 文件命令刪除HDFS下名為out的文檔
hadoop dfs -rmr out
6 查看HDFS下的某個文件
hadoop dfs cat in/*
7 使用幫助凌彬, -help commandName來獲取幫助
管理與更新
hadoop dfsadmin -report
通過‘-report’命令查看HDFS的基本統(tǒng)計信息沸柔。
退出安全模式:NameNode在啟動時會自動進去安全模式,這是NameNode的一種狀態(tài)铲敛,在這個階段褐澎,文件系統(tǒng)不允許做任何修改。他的目的是在系統(tǒng)啟動時檢查各個DataNode上數(shù)據(jù)塊的有效性伐蒋。同時根據(jù)策略對數(shù)據(jù)塊進行必要的復制和刪除工三, 當數(shù)據(jù)塊最小百分比數(shù)滿足配置的最小副本數(shù)條件時迁酸, 會自動退出安全模式。
系統(tǒng)會顯示"Name node is in safe mode"俭正,等待17秒或者使用下面的命令退出安全模式
hadoop dfsadmin -safemode leave
進入安全模式的命令
hadoop dfsadmin -safemode enter

4 添加節(jié)點
向HDFS集群中 添加節(jié)點要和NameNode使用相同的配置奸鬓,一般是直接從NameNode 上面復制。然后修改$HADOOP_HOME/conf/master文件掸读,加入NameNode主機名串远。然后在NameNode上修改$HADOOP_HOME/conf/slaves文件,再建立到新節(jié)點的無密碼ssh登錄儿惫,最后運行啟動命令bin/start-all.sh
5 負載均衡
可以使用命令bin/start-balancer.sh重新平衡DataNodeh上的數(shù)據(jù)塊的分布抑淫。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市姥闪,隨后出現(xiàn)的幾起案子始苇,更是在濱河造成了極大的恐慌,老刑警劉巖筐喳,帶你破解...
    沈念sama閱讀 222,252評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件催式,死亡現(xiàn)場離奇詭異,居然都是意外死亡避归,警方通過查閱死者的電腦和手機荣月,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評論 3 399
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來梳毙,“玉大人哺窄,你說我怎么就攤上這事≌饲拢” “怎么了萌业?”我有些...
    開封第一講書人閱讀 168,814評論 0 361
  • 文/不壞的土叔 我叫張陵,是天一觀的道長奸柬。 經(jīng)常有香客問我生年,道長,這世上最難降的妖魔是什么廓奕? 我笑而不...
    開封第一講書人閱讀 59,869評論 1 299
  • 正文 為了忘掉前任抱婉,我火速辦了婚禮,結(jié)果婚禮上桌粉,老公的妹妹穿的比我還像新娘蒸绩。我一直安慰自己,他們只是感情好铃肯,可當我...
    茶點故事閱讀 68,888評論 6 398
  • 文/花漫 我一把揭開白布患亿。 她就那樣靜靜地躺著,像睡著了一般缘薛。 火紅的嫁衣襯著肌膚如雪窍育。 梳的紋絲不亂的頭發(fā)上卡睦,一...
    開封第一講書人閱讀 52,475評論 1 312
  • 那天,我揣著相機與錄音漱抓,去河邊找鬼表锻。 笑死,一個胖子當著我的面吹牛乞娄,可吹牛的內(nèi)容都是我干的瞬逊。 我是一名探鬼主播,決...
    沈念sama閱讀 41,010評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼仪或,長吁一口氣:“原來是場噩夢啊……” “哼确镊!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起范删,我...
    開封第一講書人閱讀 39,924評論 0 277
  • 序言:老撾萬榮一對情侶失蹤蕾域,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后到旦,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體旨巷,經(jīng)...
    沈念sama閱讀 46,469評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,552評論 3 342
  • 正文 我和宋清朗相戀三年添忘,在試婚紗的時候發(fā)現(xiàn)自己被綠了采呐。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,680評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡搁骑,死狀恐怖斧吐,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情仲器,我是刑警寧澤煤率,帶...
    沈念sama閱讀 36,362評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站娄周,受9級特大地震影響涕侈,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜煤辨,卻給世界環(huán)境...
    茶點故事閱讀 42,037評論 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望木张。 院中可真熱鬧众辨,春花似錦、人聲如沸舷礼。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,519評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽妻献。三九已至蛛株,卻和暖如春团赁,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背谨履。 一陣腳步聲響...
    開封第一講書人閱讀 33,621評論 1 274
  • 我被黑心中介騙來泰國打工欢摄, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人笋粟。 一個月前我還...
    沈念sama閱讀 49,099評論 3 378
  • 正文 我出身青樓怀挠,卻偏偏與公主長得像,于是被迫代替她去往敵國和親害捕。 傳聞我的和親對象是個殘疾皇子绿淋,可洞房花燭夜當晚...
    茶點故事閱讀 45,691評論 2 361

推薦閱讀更多精彩內(nèi)容

  • 穆雅斕一個搞笑視頻網(wǎng)紅吞滞,今天位上微博熱門,各個營銷號轉(zhuǎn)她掛錯國旗盾沫,穿著軍裝用喊麥的形式搞笑的風格抵制樂天裁赠,抵制韓國...
    阿肥洪閱讀 7,824評論 54 158
  • 爸爸今天給我打了電話,喊我假期回家喝冬瓜排骨湯疮跑。先不要急著感嘆父愛的偉大组贺,真相肯定是媽媽想喝了順帶著我。我就這樣猝...
    鹿青檸_閱讀 1,359評論 2 4
  • 你的無經(jīng)驗是一筆財富祖娘,會讓你用最本能失尖、最不受局限的方式來思考問題。每當著手新事物時渐苏,你要么讓這種無經(jīng)驗將你領(lǐng)上他人...
    849e258c2fcc閱讀 209評論 0 0
  • 帶著疑問分析RxJava1.x原理:事件流源頭(observable)怎么發(fā)出數(shù)據(jù)響應者(subscriber)怎...
    liaowenhao閱讀 740評論 0 1