Hadoop學(xué)習(xí)(三)——YARN和MapReduce初體驗(yàn)

粗略了解什么是云計(jì)算胡野?
答:云計(jì)算其實(shí)就是不在同一臺(tái)機(jī)器上同時(shí)做計(jì)算璃哟,而是分布式運(yùn)算矿酵,把計(jì)算分發(fā)給多臺(tái)機(jī)器同時(shí)來(lái)進(jìn)行婴梧。
分布式計(jì)算?
答:設(shè)計(jì)原則:移動(dòng)的是計(jì)算辨绊,而不是數(shù)據(jù)奶栖。即要計(jì)算多臺(tái)機(jī)器的數(shù)據(jù)時(shí)不需要把這些數(shù)據(jù)移動(dòng)到同一臺(tái)機(jī)器上, 而是把寫(xiě)好的計(jì)算程序分別放到各自存放數(shù)據(jù)的機(jī)器上進(jìn)行計(jì)算门坷,然后再簡(jiǎn)化進(jìn)一步地進(jìn)行計(jì)算宣鄙。

一、YARN簡(jiǎn)介

是hadoop2才出現(xiàn)的資源調(diào)度層默蚌,是在HDFS上抽象的一層冻晤,其上面可以提供多種計(jì)算模型,比如MapReduce绸吸、storm等等鼻弧。YARN只為這些計(jì)算模型做資源調(diào)度,比如HDFS哪臺(tái)機(jī)器是空閑的锦茁,就把計(jì)算模型的計(jì)算指定到哪臺(tái)機(jī)器上攘轩。

進(jìn)行類比學(xué)習(xí),yarn和hdfs差不多码俩,都可以用主從架構(gòu)來(lái)學(xué)習(xí)度帮,比如在master機(jī)器上配置resourcemanager節(jié)點(diǎn),在slave機(jī)器上配置nodemanager節(jié)點(diǎn)稿存,resourcemanager節(jié)點(diǎn)管理著nodemanager節(jié)點(diǎn)笨篷。一個(gè)job來(lái)了先訪問(wèn)resourcemanager瞳秽,然后resourcemanager分發(fā)給不同的nodemanager做計(jì)算,在生成環(huán)境中resourcemanager和namenode往往是不再同一臺(tái)機(jī)器上率翅,還有yarn和hdfs在邏輯上是獨(dú)立分離的练俐,yarn可以單獨(dú)運(yùn)行,不一定要跑在hdfs上安聘,所以沒(méi)啟動(dòng)hdfs也照樣可以啟動(dòng)yarn痰洒。

二、啟動(dòng)YARN

  • 1浴韭、先配置yarn-site.xml文件,在configuration標(biāo)簽組里加上下面的配置脯宿,聲明哪臺(tái)機(jī)器是resourcemanager念颈。然后就可以在master機(jī)器上輸入命令start-yarn.sh啟動(dòng)resourcemanager然后就會(huì)根據(jù)之前配置的slaves文件去啟動(dòng)對(duì)應(yīng)不同機(jī)器的nodemanager了。注意:四臺(tái)機(jī)器的yarn-site.xml文件都要配置如下连霉,否則會(huì)出現(xiàn)明明啟動(dòng)了所有nodemanager榴芳,但隔一段時(shí)間nodemanager就消失了。
<property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
</property>
<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
</property>
<property>
        <name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>
        <value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>

效果圖
在web界面地址欄輸入主機(jī)IP名:端口號(hào)(默認(rèn)是8088)就可以訪問(wèn)了跺撼,比如10.14.28.100:8088窟感,也可以通過(guò)直接機(jī)器名:端口號(hào)(默認(rèn)是8088),比如master:8088歉井,通過(guò)機(jī)器名訪問(wèn)的這種需要在我們windows的C:\Windows\System32\drivers\etc目錄下修改hosts文件柿祈,把映射加上,瀏覽器在訪問(wèn)網(wǎng)址時(shí)會(huì)先在這個(gè)文件掃描查找有無(wú)IP對(duì)應(yīng)的主機(jī)名哩至。如下配置:

10.14.28.100 master
10.14.28.101 slave1
10.14.28.102 slave2
10.14.28.103 slave3
  • 2躏嚎、配置mapred-site.xml.template文件,在configuration標(biāo)簽組中加入如下配置菩貌,指定MapReduce計(jì)算使用YARN作為資源調(diào)度卢佣。不配置的話MapReduce程序默認(rèn)在本地運(yùn)行。
<property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
</property>

如下圖箭阶,啟動(dòng)YARN完畢虚茶。
圖片.png

三、把一個(gè)MapReduce程序在YARN上進(jìn)行調(diào)度

  • 1仇参、經(jīng)過(guò)上述步驟嘹叫,通過(guò)start-yarn.shstart-dfs.sh命令把YARN集群冈敛、HDFS集群?jiǎn)?dòng)后待笑,通過(guò)hadoop fs -put test.txt /命令在hdfs上準(zhǔn)備好一個(gè)test.txt文件,用來(lái)做一個(gè)統(tǒng)計(jì)詞數(shù)的小例子抓谴。
  • 2暮蹂、通過(guò)命令find /usr/local/hadoop -name *example*.jar來(lái)在指定路徑目錄查找含關(guān)鍵詞的文件寞缝。下面劃線的jar里包含著很多example程序,wordcount統(tǒng)計(jì)詞數(shù)就是其中一個(gè)仰泻。
    圖片.png
  • 3荆陆、使用hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar wordcount /test.txt /wcoutput命令把運(yùn)行程序?qū)χ付ǖ?test.txt文件進(jìn)行統(tǒng)計(jì),并把結(jié)果輸出到/wcoutput目錄下集侯。最后進(jìn)入/wcoutput目錄去查看結(jié)果被啼。如下圖:
    圖片.png
  • 4、WordCount(即MapReduce)的工作流程:
    先經(jīng)過(guò)input輸入文件-->接著split按行拆分文件棠枉,變成key-value形式的數(shù)據(jù)-->接著map映射浓体,相當(dāng)于繼續(xù)拆分,按單詞拆分文件-->接著shuffle派發(fā)辈讶,這時(shí)候會(huì)移動(dòng)數(shù)據(jù)了命浴,根據(jù)key把相同的單詞放在一起-->然后再reduce縮減,把單詞統(tǒng)計(jì)整理下-->最后再output輸出文件贱除。數(shù)據(jù)都存儲(chǔ)在HDFS中
    圖片.png

    附:通俗易懂理解MapReduce工作原理
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末生闲,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子月幌,更是在濱河造成了極大的恐慌碍讯,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,509評(píng)論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件扯躺,死亡現(xiàn)場(chǎng)離奇詭異捉兴,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)缅帘,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門(mén)轴术,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人钦无,你說(shuō)我怎么就攤上這事逗栽。” “怎么了失暂?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,875評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵彼宠,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我弟塞,道長(zhǎng)凭峡,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,441評(píng)論 1 293
  • 正文 為了忘掉前任决记,我火速辦了婚禮摧冀,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己索昂,他們只是感情好建车,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,488評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著椒惨,像睡著了一般缤至。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上康谆,一...
    開(kāi)封第一講書(shū)人閱讀 51,365評(píng)論 1 302
  • 那天领斥,我揣著相機(jī)與錄音,去河邊找鬼沃暗。 笑死月洛,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的孽锥。 我是一名探鬼主播膊存,決...
    沈念sama閱讀 40,190評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼忱叭!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起今艺,我...
    開(kāi)封第一講書(shū)人閱讀 39,062評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤韵丑,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后虚缎,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體撵彻,經(jīng)...
    沈念sama閱讀 45,500評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,706評(píng)論 3 335
  • 正文 我和宋清朗相戀三年实牡,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了陌僵。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,834評(píng)論 1 347
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡创坞,死狀恐怖碗短,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情题涨,我是刑警寧澤偎谁,帶...
    沈念sama閱讀 35,559評(píng)論 5 345
  • 正文 年R本政府宣布,位于F島的核電站纲堵,受9級(jí)特大地震影響巡雨,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜席函,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,167評(píng)論 3 328
  • 文/蒙蒙 一铐望、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦正蛙、人聲如沸督弓。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,779評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)咽筋。三九已至,卻和暖如春徊件,著一層夾襖步出監(jiān)牢的瞬間奸攻,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,912評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工虱痕, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留睹耐,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,958評(píng)論 2 370
  • 正文 我出身青樓部翘,卻偏偏與公主長(zhǎng)得像硝训,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子新思,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,779評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容