Hadoop支持LZO壓縮

1.環(huán)境準(zhǔn)備

maven
gcc-c++
lzo-devel
zlib-devel
autoconf
automake
libtool

maven安裝:
1)下載
wget https://mirrors.tuna.tsinghua.edu.cn/apache/maven/maven-3/3.6.3/binaries/apache-maven-3.6.3-bin.tar.gz
2)解壓
tar -zxvf apache-maven-3.6.3-bin.tar.gz
3)環(huán)境變量配置
vim /root/.bash_profile

MAVEN_HOME=/usr/local/src/apache-maven-3.6.3
export MAVEN_HOME
PATH=$MAVEN_HOME/bin:$PATH
export PATH

4)修改setting.xml,增加阿里云鏡像
vim conf/settings.xml

 <mirrors>
    <id>alimaven</id>
    <name>aliyun maven</name>
    <url>http://maven.aliyun.com/nexus/content/groups/public/</url>
    <mirrorOf>central</mirrorOf>
 </mirrors>

其他環(huán)境安裝:
yum -y install gcc-c++ lzo-devel zlib-devel autoconf automake libtool

2.下載、安裝并編譯LZO

wget http://www.oberhumer.com/opensource/lzo/download/lzo-2.10.tar.gz
tar -zxvf lzo-2.10.tar.gz
cd lzo-2.10
./configure -prefix=/usr/local/hadoop/lzo
make
make install

3.編譯hadoop-lzo源碼

1)下載源碼:wget https://github.com/twitter/hadoop-lzo/archive/master.zip
2)解壓:unzip master.zip
3)進(jìn)入/usr/local/src/hadoop-lzo-master详恼,修改pom配置
<hadoop.current.version>2.7.2</hadoop.current.version>
4)聲明兩個(gè)臨時(shí)變量
export C_INCLUDE_PATH=/usr/local/lzo/include
export LIBRARY_PATH=/usr/local/hadoop/lzo/lib
5)編譯
進(jìn)入hadoop-lzo-master執(zhí)行
mvn package -Dmaven.test.skip=true

6)進(jìn)入target呼巴,hadoop-lzo-0.4.21-SNAPSHOT.jar即是編譯成功的hadoop-lzo組件


4.hadoop配置lzo

1)將編譯好的jar放入hadoop下的common目錄下遍略,并分發(fā)到slave節(jié)點(diǎn)
cp hadoop-lzo-0.4.21-SNAPSHOT.jar /usr/local/src/hadoop-2.7.3/share/hadoop/common/
scp hadoop-lzo-0.4.21-SNAPSHOT.jar slave1:/usr/local/src/hadoop-2.7.3/share/hadoop/common/
scp hadoop-lzo-0.4.21-SNAPSHOT.jar slave2:/usr/local/src/hadoop-2.7.3/share/hadoop/common/
scp hadoop-lzo-0.4.21-SNAPSHOT.jar slave3:/usr/local/src/hadoop-2.7.3/share/hadoop/common/
2)配置hadoop下的core-site.xml,在configuration下增加:

<property>
    <name>io.compression.codecs</name>
    <value>
        org.apache.hadoop.io.compress.GzipCodec,
        org.apache.hadoop.io.compress.DefaultCodec,
        org.apache.hadoop.io.compress.BZip2Codec,
        org.apache.hadoop.io.compress.SnappyCodec,
        com.hadoop.compression.lzo.LzoCodec,
        com.hadoop.compression.lzo.LzopCodec
    </value>
</property> 

<property>
    <name>io.compression.codec.lzo.class</name>
    <value>com.hadoop.compression.lzo.LzoCodec</value>
</property> 

增加完畢后分發(fā):
scp core-site.xml slave1:$PWD
scp core-site.xml slave2:$PWD
scp core-site.xml slave3:$PWD
3)啟動(dòng)hadoop
start-dfs.sh
start-yarn.sh

5.LZO創(chuàng)建索引

1)上傳文件
hadoop fs -put bigtable.lzo /input
2)對上傳的LZO文件建索引
創(chuàng)建LZO文件的索引果录,LZO壓縮文件的可切片特性依賴于其索引讹开,故我們需要手動(dòng)為
LZO壓縮文件創(chuàng)建索引。若無索引易茬,LZO文件的切片只有一個(gè)酬蹋。
hadoop jar /usr/local/src/hadoop-2.7.3/share/hadoop/common/hadoop-lzo-0.4.21-SNAPSHOT.jar com.hadoop.compression.lzo.DistributedLzoIndexer /input/bigtable.lzo


3)執(zhí)行wordcount程序
hadoop jar /usr/local/src/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /input /output1


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市抽莱,隨后出現(xiàn)的幾起案子范抓,更是在濱河造成了極大的恐慌,老刑警劉巖食铐,帶你破解...
    沈念sama閱讀 212,599評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件匕垫,死亡現(xiàn)場離奇詭異,居然都是意外死亡虐呻,警方通過查閱死者的電腦和手機(jī)象泵,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,629評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來斟叼,“玉大人偶惠,你說我怎么就攤上這事±噬” “怎么了忽孽?”我有些...
    開封第一講書人閱讀 158,084評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長谢床。 經(jīng)常有香客問我兄一,道長,這世上最難降的妖魔是什么识腿? 我笑而不...
    開封第一講書人閱讀 56,708評論 1 284
  • 正文 為了忘掉前任出革,我火速辦了婚禮,結(jié)果婚禮上渡讼,老公的妹妹穿的比我還像新娘骂束。我一直安慰自己,他們只是感情好成箫,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,813評論 6 386
  • 文/花漫 我一把揭開白布展箱。 她就那樣靜靜地躺著,像睡著了一般伟众。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上召廷,一...
    開封第一講書人閱讀 50,021評論 1 291
  • 那天凳厢,我揣著相機(jī)與錄音账胧,去河邊找鬼。 笑死先紫,一個(gè)胖子當(dāng)著我的面吹牛治泥,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播遮精,決...
    沈念sama閱讀 39,120評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼居夹,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了本冲?” 一聲冷哼從身側(cè)響起准脂,我...
    開封第一講書人閱讀 37,866評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎檬洞,沒想到半個(gè)月后狸膏,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,308評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡添怔,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,633評論 2 327
  • 正文 我和宋清朗相戀三年湾戳,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片广料。...
    茶點(diǎn)故事閱讀 38,768評論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡砾脑,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出艾杏,到底是詐尸還是另有隱情韧衣,我是刑警寧澤,帶...
    沈念sama閱讀 34,461評論 4 333
  • 正文 年R本政府宣布糜颠,位于F島的核電站汹族,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏其兴。R本人自食惡果不足惜顶瞒,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,094評論 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望元旬。 院中可真熱鬧榴徐,春花似錦、人聲如沸匀归。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,850評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽穆端。三九已至袱贮,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間体啰,已是汗流浹背攒巍。 一陣腳步聲響...
    開封第一講書人閱讀 32,082評論 1 267
  • 我被黑心中介騙來泰國打工嗽仪, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人柒莉。 一個(gè)月前我還...
    沈念sama閱讀 46,571評論 2 362
  • 正文 我出身青樓闻坚,卻偏偏與公主長得像,于是被迫代替她去往敵國和親兢孝。 傳聞我的和親對象是個(gè)殘疾皇子窿凤,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,666評論 2 350