Sqoop之環(huán)境搭建

本文介紹了使用Sqoop導(dǎo)入MYSQL數(shù)據(jù)到Hive&Hbase之中。

主要內(nèi)容:

  • 1.下載

1.下載

下載地址

sqoop版本下載

2.安裝

2.1.解壓

tar -zxvf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz -C /opt/soft

2.2.設(shè)置環(huán)境變量

cd conf/
mv sqoop-env-template.sh sqoop-env.sh
vi sqoop-env.sh

加入如下配置

#Set path to where bin/hadoop is available
export HADOOP_COMMON_HOME=/opt/soft/hadoop-2.7.3

#Set path to where hadoop-*-core.jar is available
export HADOOP_MAPRED_HOME=/opt/soft/hadoop-2.7.3

#set the path to where bin/hbase is available
export HBASE_HOME=/opt/soft/hbase-1.2.6

#Set the path to where bin/hive is available
export HIVE_HOME=/opt/soft/apache-hive-1.2.2-bin

#Set the path for where zookeper config dir is
export ZOOCFGDIR=/opt/soft/zookeeper-3.4.10

2.3.復(fù)制MySQL驅(qū)動(dòng)

cp /opt/soft-install/mysql-connector-java-5.1.32.jar /opt/soft/sqoop-1.4.7.bin__hadoop-2.6.0/lib/

2.4.復(fù)制Hive的jar

cp /opt/soft/apache-hive-1.2.2-bin/lib/hive-shims-0.23-1.2.2.jar /opt/soft/sqoop-1.4.7.bin__hadoop-2.6.0/lib/
cp /opt/soft/apache-hive-1.2.2-bin/lib/hive-common-1.2.2.jar /opt/soft/sqoop-1.4.7.bin__hadoop-2.6.0/lib/
cp /opt/soft/apache-hive-1.2.2-bin/lib/hive-shims-common-1.2.2.jar /opt/soft/sqoop-1.4.7.bin__hadoop-2.6.0/lib/

3.常用命令

3.1.查看命令

[hadoop@hadoop1 sqoop-1.4.7.bin__hadoop-2.6.0]$ ./bin/sqoop help
Warning: /opt/soft/sqoop-1.4.7.bin__hadoop-2.6.0//../hcatalog does not exist! HCatalog jobs will fail.
Please set $HCAT_HOME to the root of your HCatalog installation.
Warning: /opt/soft/sqoop-1.4.7.bin__hadoop-2.6.0//../accumulo does not exist! Accumulo imports will fail.
Please set $ACCUMULO_HOME to the root of your Accumulo installation.
19/02/14 17:46:41 INFO sqoop.Sqoop: Running Sqoop version: 1.4.7
usage: sqoop COMMAND [ARGS]

Available commands:
  codegen            Generate code to interact with database records
  create-hive-table  Import a table definition into Hive
  eval               Evaluate a SQL statement and display the results
  export             Export an HDFS directory to a database table
  help               List available commands
  import             Import a table from a database to HDFS
  import-all-tables  Import tables from a database to HDFS
  import-mainframe   Import datasets from a mainframe server to HDFS
  job                Work with saved jobs
  list-databases     List available databases on a server
  list-tables        List available tables in a database
  merge              Merge results of incremental imports
  metastore          Run a standalone Sqoop metastore
  version            Display version information

See 'sqoop help COMMAND' for information on a specific command.

3.2.查看版本

[hadoop@hadoop1 sqoop-1.4.7.bin__hadoop-2.6.0]$ ./bin/sqoop version
Warning: /opt/soft/sqoop-1.4.7.bin__hadoop-2.6.0//../hcatalog does not exist! HCatalog jobs will fail.
Please set $HCAT_HOME to the root of your HCatalog installation.
Warning: /opt/soft/sqoop-1.4.7.bin__hadoop-2.6.0//../accumulo does not exist! Accumulo imports will fail.
Please set $ACCUMULO_HOME to the root of your Accumulo installation.
19/02/14 17:46:51 INFO sqoop.Sqoop: Running Sqoop version: 1.4.7
Sqoop 1.4.7
git commit id 2328971411f57f0cb683dfb79d19d4d19d185dd8
Compiled by maugli on Thu Dec 21 15:59:58 STD 2017

3.3.導(dǎo)入MySQL數(shù)據(jù)到HDFS

sqoop import   \
--connect jdbc:mysql://hadoop1:3306/mysql  \
--username root  \
--password root   \
--target-dir /data/input/SysCodeType.txt  \
--query 'select id,code_type_num,code_type_name from sys_code_type where $CONDITIONS and is_deleted=0'  \
--split-by  id  \
--fields-terminated-by '\t'  \
-m 1

3.4.導(dǎo)入MySQL數(shù)據(jù)到Hive

指定行分隔符和列分隔符枫吧,指定hive-import贯城,指定覆蓋導(dǎo)入,指定自動(dòng)創(chuàng)建hive表戚扳,指定表名芭碍,指定刪除中間結(jié)果數(shù)據(jù)目錄

sqoop import  \
--connect jdbc:mysql://hadoop1:3306/mysql  \
--username root  \
--password root  \
--table sys_code_type  \
--fields-terminated-by "\t"  \
--lines-terminated-by "\n"  \
--hive-import  \
--hive-overwrite  \
--create-hive-table  \
--delete-target-dir \
--hive-database  test \
--hive-table sys_code_type

進(jìn)入Hive查看結(jié)果:

hive> use test;
OK
Time taken: 1.599 seconds
hive> show tables;
OK
person
student
sys_code_type
Time taken: 1.212 seconds, Fetched: 3 row(s)
hive> select * from sys_code_type;
OK
1029197104365404162     XXBXLXB schoolRunType   學(xué)校辦學(xué)類型表  學(xué)校辦學(xué)類型表  0       null    null    1027740701250162689     2019-01-21 11:29:06.0   4 null     null

可以看到數(shù)據(jù)已經(jīng)導(dǎo)入Hive表了董瞻。

3.5導(dǎo)入MySQL數(shù)據(jù)到Hbase

先在Hbase里創(chuàng)建表

create 'sys_code_type ','f1'

將數(shù)據(jù)導(dǎo)入到Hbase

sqoop import \
--connect jdbc:mysql://hadoop1:3306/auto_study \
--username root \
--password root \
--table sys_code_type \
--hbase-table sys_code_type \
--column-family f1\
--hbase-row-key id

參考:

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市峻村,隨后出現(xiàn)的幾起案子麸折,更是在濱河造成了極大的恐慌,老刑警劉巖粘昨,帶你破解...
    沈念sama閱讀 221,198評(píng)論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件垢啼,死亡現(xiàn)場離奇詭異窜锯,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)芭析,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評(píng)論 3 398
  • 文/潘曉璐 我一進(jìn)店門锚扎,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人馁启,你說我怎么就攤上這事驾孔。” “怎么了进统?”我有些...
    開封第一講書人閱讀 167,643評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵助币,是天一觀的道長。 經(jīng)常有香客問我螟碎,道長眉菱,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,495評(píng)論 1 296
  • 正文 為了忘掉前任掉分,我火速辦了婚禮俭缓,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘酥郭。我一直安慰自己华坦,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,502評(píng)論 6 397
  • 文/花漫 我一把揭開白布不从。 她就那樣靜靜地躺著惜姐,像睡著了一般。 火紅的嫁衣襯著肌膚如雪椿息。 梳的紋絲不亂的頭發(fā)上歹袁,一...
    開封第一講書人閱讀 52,156評(píng)論 1 308
  • 那天,我揣著相機(jī)與錄音寝优,去河邊找鬼条舔。 笑死,一個(gè)胖子當(dāng)著我的面吹牛乏矾,可吹牛的內(nèi)容都是我干的孟抗。 我是一名探鬼主播,決...
    沈念sama閱讀 40,743評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼钻心,長吁一口氣:“原來是場噩夢啊……” “哼凄硼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起捷沸,我...
    開封第一講書人閱讀 39,659評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤帆喇,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后亿胸,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體坯钦,經(jīng)...
    沈念sama閱讀 46,200評(píng)論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,282評(píng)論 3 340
  • 正文 我和宋清朗相戀三年侈玄,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了婉刀。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,424評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡序仙,死狀恐怖突颊,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情潘悼,我是刑警寧澤律秃,帶...
    沈念sama閱讀 36,107評(píng)論 5 349
  • 正文 年R本政府宣布,位于F島的核電站治唤,受9級(jí)特大地震影響棒动,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜宾添,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,789評(píng)論 3 333
  • 文/蒙蒙 一船惨、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧缕陕,春花似錦粱锐、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評(píng)論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至蔬崩,卻和暖如春恶座,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背舱殿。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評(píng)論 1 271
  • 我被黑心中介騙來泰國打工奥裸, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人沪袭。 一個(gè)月前我還...
    沈念sama閱讀 48,798評(píng)論 3 376
  • 正文 我出身青樓湾宙,卻偏偏與公主長得像,于是被迫代替她去往敵國和親冈绊。 傳聞我的和親對(duì)象是個(gè)殘疾皇子侠鳄,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,435評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容

  • Sqoop是一種用于在Hadoop和關(guān)系數(shù)據(jù)庫或大型機(jī)之間傳輸數(shù)據(jù)的工具。您可以使用Sqoop從關(guān)系數(shù)據(jù)庫管理系統(tǒng)...
    糧憶雨閱讀 2,159評(píng)論 0 2
  • 1/列出mysql數(shù)據(jù)庫中的所有數(shù)據(jù)庫sqoop list-databases -connect jdbc:mys...
    時(shí)待吾閱讀 2,741評(píng)論 1 5
  • 上節(jié)課學(xué)習(xí)了Hadoop集群測試死宣,這節(jié)課我們一起學(xué)習(xí)一下Sqoop伟恶,Sqoop是專門用來遷移數(shù)據(jù)的,它可以把數(shù)據(jù)庫...
    文子軒閱讀 6,941評(píng)論 1 9
  • 簡介 HBase是高可靠性毅该,高性能博秫,面向列潦牛,可伸縮的分布式存儲(chǔ)系統(tǒng),利用HBase技術(shù)可在廉價(jià)PC Serve...
    九世的貓閱讀 2,195評(píng)論 1 6
  • Apache Sqoop 概述 使用Hadoop來分析和處理數(shù)據(jù)需要將數(shù)據(jù)加載到集群中并且將它和企業(yè)生產(chǎn)數(shù)據(jù)庫中的...
    和心數(shù)據(jù)閱讀 1,309評(píng)論 0 8