【Hadoop】

vim /etc/hostname  # 修改主機名稱
vim /etc/hosts # 修改主機host映射


# 關閉防火墻
systemctl stop firewalld
systemctl disable firewalld.service

安裝hadoop

上傳 hadoop-3.2.4.tar.gz 到/opt/software/
tar -zxvf hadoop-3.2.4.tar.gz -C /opt/module/
mv hadoop-3.2.4 hadoop

sudo vim /etc/profile.d/my_env.sh

添加hadoop環(huán)境變量
#HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

source /etc/profile.d/my_env.sh

核心配置文件

core-site.xml配置
cd $HADOOP_HOME/etc/hadoop
vim core-site.xml

文件內容如下:

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>
    <!-- 指定NameNode的地址 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://hadoop102:8020</value>
    </property>

   <!-- 指定hadoop數(shù)據(jù)的存儲目錄 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/module/hadoop/data</value>
   </property>

    <!-- 配置HDFS網頁登錄使用的靜態(tài)用戶為qani -->
    <property>
        <name>hadoop.http.staticuser.user</name>
        <value>qani</value>
    </property>

    <!-- 配置該qani(superUser)允許通過代理訪問的主機節(jié)點 -->
    <property>
        <name>hadoop.proxyuser.qani.hosts</name>
        <value>*</value>
    </property>

   <!-- 配置該qani(superUser)允許通過代理用戶所屬組 -->
   <property>
        <name>hadoop.proxyuser.qani.groups</name>
        <value>*</value>
   </property>

   <!-- 配置該qani(superUser)允許通過代理的用戶-->
    <property>
        <name>hadoop.proxyuser.qani.users</name>
        <value>*</value>
    </property>
</configuration>
hdfs-site.xml配置

文件內容如下:

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>
    <!-- nn web端訪問地址-->
    <property>
        <name>dfs.namenode.http-address</name>
        <value>hadoop102:9870</value>
    </property>
    
    <!-- 2nn web端訪問地址-->
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>hadoop104:9868</value>
    </property>
    
    <!-- 測試環(huán)境指定HDFS副本的數(shù)量1 -->
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>
yarn-site.xml配置
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>
    <!-- 指定MR走shuffle -->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    
    <!-- 指定ResourceManager的地址-->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoop103</value>
    </property>
    
    <!-- 環(huán)境變量的繼承 -->
    <property>
        <name>yarn.nodemanager.env-whitelist</name>
        <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>
    </property>
    
    <!--yarn單個容器允許分配的最大最小內存 -->
    <property>
        <name>yarn.scheduler.minimum-allocation-mb</name>
        <value>512</value>
    </property>
    <property>
        <name>yarn.scheduler.maximum-allocation-mb</name>
        <value>4096</value>
    </property>
    
    <!-- yarn容器允許管理的物理內存大小 -->
    <property>
        <name>yarn.nodemanager.resource.memory-mb</name>
        <value>4096</value>
    </property>
    
    <!-- 關閉yarn對物理內存和虛擬內存的限制檢查 -->
    <property>
        <name>yarn.nodemanager.pmem-check-enabled</name>
        <value>true</value>
    </property>
    <property>
        <name>yarn.nodemanager.vmem-check-enabled</name>
        <value>false</value>
    </property>

    <!-- 開啟日志聚集功能 -->
    <property>
        <name>yarn.log-aggregation-enable</name>
        <value>true</value>
    </property>

    <!-- 設置日志聚集服務器地址 -->
    <property>  
        <name>yarn.log.server.url</name>  
        <value>http://hadoop102:19888/jobhistory/logs</value>
    </property>

    <!-- 設置日志保留時間為7天 -->
    <property>
        <name>yarn.log-aggregation.retain-seconds</name>
        <value>604800</value>
    </property>
</configuration>
mapred-site.xml配置
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>
    <!-- 指定MapReduce程序運行在Yarn上 -->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>

    <!-- 歷史服務器端地址 -->
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>hadoop102:10020</value>
    </property>

    <!-- 歷史服務器web端地址 -->
    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>hadoop102:19888</value>
    </property>
</configuration>
配置workers
vim /opt/module/hadoop/etc/hadoop/workers

在該文件中增加如下內容:

hadoop102
hadoop103
hadoop104

啟動Hadoop

sbin/start-dfs.sh
sbin/start-yarn.sh
bin/mapred --daemon start historyserver  # 啟動 historyserver

Web端查看HDFS的Web頁面:http://hadoop102:9870/
Web端查看SecondaryNameNode攒发,瀏覽器中輸入:http://hadoop104:9868/status.html

Hadoop啟動腳本

#!/bin/bash
if [ $# -lt 1 ]
then
    echo "No Args Input..."
    exit ;
fi

case $1 in
"start")
        echo " =================== 啟動 hadoop集群 ==================="

        echo " --------------- 啟動 hdfs ---------------"
        ssh hadoop102 "/opt/module/hadoop/sbin/start-dfs.sh"
        echo " --------------- 啟動 yarn ---------------"
        ssh hadoop103 "/opt/module/hadoop/sbin/start-yarn.sh"
        echo " --------------- 啟動 historyserver ---------------"
        ssh hadoop102 "/opt/module/hadoop/bin/mapred --daemon start historyserver"
;;
"stop")
        echo " =================== 關閉 hadoop集群 ==================="

        echo " --------------- 關閉 historyserver ---------------"
        ssh hadoop102 "/opt/module/hadoop/bin/mapred --daemon stop historyserver"
        echo " --------------- 關閉 yarn ---------------"
        ssh hadoop103 "/opt/module/hadoop/sbin/stop-yarn.sh"
        echo " --------------- 關閉 hdfs ---------------"
        ssh hadoop102 "/opt/module/hadoop/sbin/stop-dfs.sh"
;;
*)
    echo "Input Args Error..."
;;
esac

hadoop常用命令

查看 Job 信息:  
hadoop job -list 

殺掉 Job:         
hadoop job –kill job_id

yarn application --list --all
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末卷哩,一起剝皮案震驚了整個濱河市传惠,隨后出現(xiàn)的幾起案子雹顺,更是在濱河造成了極大的恐慌瘸恼,老刑警劉巖儿咱,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異噪叙,居然都是意外死亡渐裂,警方通過查閱死者的電腦和手機豺旬,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門钠惩,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人族阅,你說我怎么就攤上這事篓跛。” “怎么了耘分?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵举塔,是天一觀的道長。 經常有香客問我求泰,道長,這世上最難降的妖魔是什么计盒? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任渴频,我火速辦了婚禮,結果婚禮上北启,老公的妹妹穿的比我還像新娘卜朗。我一直安慰自己,他們只是感情好咕村,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布场钉。 她就那樣靜靜地躺著,像睡著了一般懈涛。 火紅的嫁衣襯著肌膚如雪逛万。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天批钠,我揣著相機與錄音宇植,去河邊找鬼。 笑死埋心,一個胖子當著我的面吹牛指郁,可吹牛的內容都是我干的。 我是一名探鬼主播拷呆,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼闲坎,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了茬斧?” 一聲冷哼從身側響起腰懂,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎啥供,沒想到半個月后悯恍,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡伙狐,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年涮毫,在試婚紗的時候發(fā)現(xiàn)自己被綠了瞬欧。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡罢防,死狀恐怖艘虎,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情咒吐,我是刑警寧澤野建,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站恬叹,受9級特大地震影響候生,放射性物質發(fā)生泄漏。R本人自食惡果不足惜绽昼,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一唯鸭、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧硅确,春花似錦目溉、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至循未,卻和暖如春陷猫,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背只厘。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工烙丛, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人羔味。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓河咽,卻偏偏與公主長得像,于是被迫代替她去往敵國和親赋元。 傳聞我的和親對象是個殘疾皇子忘蟹,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內容