2008年美國每個月最低氣溫分析
1.點擊https://pan.baidu.com/s/1c1MPnSs下載2008.txt文件(這里是將2008.txt文件放在E盤中鸠踪,跟Hadoop文件同處于一個盤)
2.在命令提示符下 Hadoop-2.7.3\sbin 中輸入 start-all.cmd 開啟Hadoop服務(wù)
3.準(zhǔn)備輸入睦刃、輸出文件夾答倡,在HDFS文件系統(tǒng)中創(chuàng)建菠净。
Hadoop中所有的數(shù)據(jù)都必須放在HDFS文件系統(tǒng)中進行處理鸣哀。
命令提示符中 Hadoop-2.7.3\sbin 下輸入 hadoop fs -mkdir hdfs://localhost:9000/test/2008input(創(chuàng)建文件夾蝙眶,localhost:9000為hdfs的系統(tǒng)目錄失晴,test和2008input是現(xiàn)在要創(chuàng)建的文件名靡狞,具體命名根據(jù)自己的需要)
輸入 hadoop fs -ls hdfs://localhost:9000/test/ 查看文件是否創(chuàng)建成功
4.上傳需要統(tǒng)計的 t1 文件到 hdfs://localhost:9000/test/input1 上
hadoop fs -put E:\2008.txt hdfs://localhost:9000/test/2008input
5.下載https://pan.baidu.com/s/1o87RVXS中的mintemp.jar到E盤中耻警。
mintemp.jar是Java編寫的一個MapReduce計算最低氣溫的程序
6. 在jar包所在的路徑,執(zhí)行以下命令 hadoop jar mintemp.jar hdfs://localhost:9000/test/2008input hdfs://localhost:9000/test/2008output耍攘,運行命令之后榕栏,顯示如下
7.hadoop fs -ls hdfs://localhost:9000/test/2008output查看結(jié)果文件
8.hadoop fs -cat hdfs://localhost:9000/test/2008output/patr-r-00000查看輸出結(jié)果
9.hadoop fs -get hdfs://localhost:9000/test/2008output/patr-r-00000 下載計算結(jié)果到本地