Sqoop的導(dǎo)入導(dǎo)出

sqoop的功能架構(gòu)

sqoop是能夠在hdfs和關(guān)系型數(shù)據(jù)庫(kù)之間進(jìn)行數(shù)據(jù)量大的數(shù)據(jù)轉(zhuǎn)換工具,底層運(yùn)行的是mapreduce項(xiàng)目,是Apache的頂級(jí)項(xiàng)目劫瞳。


hive3.png

從架構(gòu)圖可以看出呕童,sqoop相當(dāng)于是hadoop中mapreduce的客戶(hù)端,在sqoop client中執(zhí)行命令意蛀,命令會(huì)被解析成轉(zhuǎn)換為mapreduce任務(wù)(一般只涉及map任務(wù)耸别,不會(huì)涉及到reduce任務(wù)),然后打成jar包提交給YARN運(yùn)行县钥。因?yàn)閔ive和hbase的底層還是hdfs秀姐,所以也可以讓關(guān)系型數(shù)據(jù)和hvie、hbase之間進(jìn)行數(shù)據(jù)轉(zhuǎn)換若贮。

sqoop的使用要點(diǎn)

在sqoop的命令行中執(zhí)行命令囊扳,進(jìn)行數(shù)據(jù)的導(dǎo)入和導(dǎo)出。


hive2.png
  • 連接關(guān)系型數(shù)據(jù)庫(kù)需要jdbc路徑兜看、用戶(hù)名锥咸、密碼、表名信息细移。
  • 數(shù)據(jù)是導(dǎo)入還是導(dǎo)出搏予,是相對(duì)于hadoop中的hdfs來(lái)說(shuō)的,而不是關(guān)系型數(shù)據(jù)庫(kù)弧轧。
  • 數(shù)據(jù)不僅可以轉(zhuǎn)換到HDFS中雪侥,還可以直接轉(zhuǎn)換至hive、hbase中精绎。

導(dǎo)入數(shù)據(jù)到HDFS

sqoop執(zhí)行命令時(shí)速缨,首先到關(guān)系型數(shù)據(jù)庫(kù)中獲取表的相關(guān)元數(shù)據(jù),然后啟動(dòng)只包含map的mapreduce任務(wù)并行的導(dǎo)入數(shù)據(jù)代乃。

  • mysql中創(chuàng)建的測(cè)試數(shù)據(jù)

create database if not exists sqoop;
use sqoop;
create table if not exists tohdfs;
insert into tohdfs values('1','aa');
insert into tohdfs values('2','bb');
insert into tohdfs values('3','cc');
insert into tohdfs values('4','dd');

hive4.png
  • 默認(rèn)情況下導(dǎo)入到HDFS家目錄中


    hive5.png

    hive6.png

    如果沒(méi)有指定數(shù)據(jù)存儲(chǔ)到什么目錄旬牲,默認(rèn)情況下是HDFS的用戶(hù)主目錄仿粹,因?yàn)榇藭r(shí)執(zhí)行命令的是wulei,所以目錄為/user/wulei/原茅。因?yàn)橹簧闪艘粋€(gè)mapper任務(wù)吭历,所以tohdfs目錄下只有一個(gè)文件。同時(shí)可以發(fā)現(xiàn)數(shù)據(jù)轉(zhuǎn)移到HDFS后擂橘,默認(rèn)的列分隔符為"晌区,"。

  • 指定目錄通贞、mapper個(gè)數(shù)和分隔符朗若。

bin/sqoop import
--connect jdbc:mysql://bigdata-00:3306/sqoop
--username root
--password 123456
--table tohdfs \

--target-dir /user/wulei/sqoop/input
--num-mappers 3
--fields-terminated-by "\t"
--delete-target-dir

hive7.png

hive8.png

其中--target-dir為指定目錄 --num-mappers 指定mapper的個(gè)數(shù) --fields-terminated-by 指定列分隔符。需要注意的是昌罩,此時(shí)這個(gè)目錄一定不能已經(jīng)存在捡偏,否則會(huì)報(bào)錯(cuò);可以添加--delete-target-dir參數(shù)提前刪除這個(gè)目錄峡迷。
** 數(shù)據(jù)文件會(huì)導(dǎo)入到用戶(hù)家目錄银伟,然后再移動(dòng)到指定的目標(biāo)目錄 **

  • 使用--direct快速導(dǎo)入。利用了數(shù)據(jù)庫(kù)的導(dǎo)入工具绘搞,如mysql的mysqlimport彤避,可以比jdbc連接后導(dǎo)入的方式更加高效的導(dǎo)入到HDFS中。
    沒(méi)用--direct的時(shí)間:


    hive9.png

    使用--direct的時(shí)間:

bin/sqoop import
--connect jdbc:mysql://bigdata-00:3306/sqoop
--username root
--password 123456
--table tohdfs
--target-dir /user/wulei/sqoop/input
--num-mappers 3
--fields-terminated-by "\t"
--delete-target-dir
--direct

hive10.png
  • 增量導(dǎo)入
    --check-column (col) 檢查指定的列夯辖,根據(jù)此列判斷哪些記錄是新數(shù)據(jù)且需要導(dǎo)入的琉预,列不能是字符相關(guān)類(lèi)型
    --incremental (mode) 指定增量模式,mode包含兩種方式:append和lastmodified
  • append: 當(dāng)表中的記錄是以id持續(xù)增加導(dǎo)入新的記錄的時(shí)候蒿褂,可以使 用append模式圆米,--check-column id 用于檢查id
  • lastmodified: 表有時(shí)候也會(huì)執(zhí)行更新操作,此時(shí)可以使用lastmodified導(dǎo)入

--last-value (value): 指定某個(gè)值啄栓,將大于該值的檢查列記錄導(dǎo)入娄帖,以確定僅將新的或者更新后的記錄導(dǎo)入新的文件系統(tǒng)


hive12.png

hive11.png

導(dǎo)出數(shù)據(jù)到關(guān)系型數(shù)據(jù)庫(kù)中

bin/sqoop export
--connect jdbc:mysql://bigdata-00:3306/sqoop
--username root
--password 123456
--table tomysql
--num-mappers 1
--input-fields-terminated-by "\t"
--export-dir /user/wulei/sqoop/input/part-m-00000

hive13.png

從MySQL導(dǎo)入數(shù)據(jù)到Hive

** 會(huì)先將mysql中的數(shù)據(jù)存儲(chǔ)到hdfs用戶(hù)目錄下,然后再移動(dòng)到Hive對(duì)應(yīng)的HDFS目錄中**

bin/sqoop import
--connect jdbc:mysql://bigdata-00:3306/sqoop
--username root
--password 123456
--table tohdfs
--num-mappers 1
--fields-terminated-by "\t"
--delete-target-dir
--hive-import
--hive-database tohive_db
--hive-table tohive

hive15.png

從Hive中導(dǎo)出數(shù)據(jù)到MySQL

** 和hdfs導(dǎo)出數(shù)據(jù)到mysql相同,把導(dǎo)出目標(biāo)目錄轉(zhuǎn)換為表路徑 **

bin/sqoop export --connect jdbc:mysql://bigdata-00:3306/sqoop
--username root
--password 123456
--table tomysql
--num-mappers 1
--input-fields-terminated-by "\t"
--export-dir /user/wulei/sqoop/input/

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末昙楚,一起剝皮案震驚了整個(gè)濱河市近速,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌堪旧,老刑警劉巖削葱,帶你破解...
    沈念sama閱讀 217,734評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異淳梦,居然都是意外死亡析砸,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,931評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門(mén)爆袍,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)首繁,“玉大人作郭,你說(shuō)我怎么就攤上這事÷椋” “怎么了所坯?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,133評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵谆扎,是天一觀的道長(zhǎng)挂捅。 經(jīng)常有香客問(wèn)我,道長(zhǎng)堂湖,這世上最難降的妖魔是什么闲先? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,532評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮无蜂,結(jié)果婚禮上伺糠,老公的妹妹穿的比我還像新娘。我一直安慰自己斥季,他們只是感情好训桶,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,585評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著酣倾,像睡著了一般舵揭。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上躁锡,一...
    開(kāi)封第一講書(shū)人閱讀 51,462評(píng)論 1 302
  • 那天午绳,我揣著相機(jī)與錄音,去河邊找鬼映之。 笑死拦焚,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的杠输。 我是一名探鬼主播赎败,決...
    沈念sama閱讀 40,262評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼蠢甲!你這毒婦竟也來(lái)了螟够?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,153評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤峡钓,失蹤者是張志新(化名)和其女友劉穎妓笙,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體能岩,經(jīng)...
    沈念sama閱讀 45,587評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡寞宫,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,792評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了拉鹃。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片辈赋。...
    茶點(diǎn)故事閱讀 39,919評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡鲫忍,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出钥屈,到底是詐尸還是另有隱情悟民,我是刑警寧澤,帶...
    沈念sama閱讀 35,635評(píng)論 5 345
  • 正文 年R本政府宣布篷就,位于F島的核電站射亏,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏竭业。R本人自食惡果不足惜智润,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,237評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望未辆。 院中可真熱鬧窟绷,春花似錦、人聲如沸咐柜。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,855評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)拙友。三九已至为狸,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間献宫,已是汗流浹背钥平。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,983評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留姊途,地道東北人涉瘾。 一個(gè)月前我還...
    沈念sama閱讀 48,048評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像捷兰,于是被迫代替她去往敵國(guó)和親立叛。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,864評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 1/列出mysql數(shù)據(jù)庫(kù)中的所有數(shù)據(jù)庫(kù)sqoop list-databases -connect jdbc:mys...
    時(shí)待吾閱讀 2,739評(píng)論 1 5
  • 1/列出mysql數(shù)據(jù)庫(kù)中的所有數(shù)據(jù)庫(kù)sqoop list-databases -connect jdbc:mys...
    時(shí)待吾閱讀 1,350評(píng)論 0 0
  • Spark SQL, DataFrames and Datasets Guide Overview SQL Dat...
    Joyyx閱讀 8,328評(píng)論 0 16
  • 1.大數(shù)據(jù)協(xié)作框架: 大數(shù)據(jù)協(xié)作框架是Hadoop 2.x生態(tài)系統(tǒng)中幾個(gè)輔助框架贡茅。最為常見(jiàn)的是以下幾個(gè): 數(shù)據(jù)轉(zhuǎn)換...
    奉先閱讀 3,066評(píng)論 0 2
  • 當(dāng)你不再證明自己的時(shí)候秘蛇, 神性,就出來(lái)了顶考! 美就綻放 了赁还! 你不需要證明你自己! 沒(méi)有一棵樹(shù)驹沿,需要證明它是樹(shù)艘策! 你...
    親愛(ài)的云兒姐閱讀 646評(píng)論 1 1