啟動(dòng)Hadoop
前置準(zhǔn)備:
- 安裝JDK
『 Hadoop』從零安裝第一彈 - 簡(jiǎn)書(shū)
http://www.reibang.com/p/5b334ecc335c - 安裝Hadoop
『 Hadoop』從零安裝第二彈 - 簡(jiǎn)書(shū)
http://www.reibang.com/p/12debc5f1da2
- 進(jìn)入到 ~/software/hadoop/hadoop-2.6.0/etc/hadoop目錄
$ cd ~/software/hadoop/hadoop-2.6.0/etc/hadoop
- 編輯hadoop-env.sh文件渗柿,修改參數(shù)信息
$ sudo gedit hadoop-env.sh
- 測(cè)試Hadoop環(huán)境可用性
$ hadoop
使用hadoop的本地單獨(dú)模式
例子說(shuō)明:一個(gè)計(jì)數(shù)的例子
使用hadoop自帶的hadoop-mapreduce-examples-2.6.0.jar
對(duì)某目錄下的文檔進(jìn)行單詞數(shù)的統(tǒng)計(jì)
- 執(zhí)行命令
$ cd ~/software/hadoop
$ mkdir input - 把hadoop目錄下的所有尾綴為xml的文件拷貝到input文件夾下
$ cp $HADOOP_HOME/etc/hadoop/.xml input/* -
等待幾分鐘運(yùn)行
-
執(zhí)行的結(jié)果
-
查看輸出的結(jié)果
至此成功啟動(dòng)hadoop!
實(shí)力分析下例子
$hadoop jar 執(zhí)行jar包
然后加上jar包的路徑
grep是一個(gè)自定義類(lèi)7图堋侥锦!不是原本Linux的命令
傳入3個(gè)參數(shù)到grep類(lèi)帘不,第一個(gè)參數(shù)是輸入文件夾种冬,第二個(gè)是輸出的文件夾,第三是正則表達(dá)式的查詢(xún)規(guī)則 (此時(shí)路徑是相對(duì)路徑)
正則表達(dá)式要查找的是以dfs開(kāi)頭的任意長(zhǎng)度的字符串
結(jié)果是只有一個(gè)绑雄,即dfsadmin