如何在 Hue 3.10 中提交 Sqoop1 作業(yè)扬舒?

前言

本來認(rèn)為這塊是很簡(jiǎn)單的事兒讲坎,不想單獨(dú)記錄下來愧薛,恐怖的是花了2小時(shí)時(shí)間才調(diào)通(之前踩過的坑又踩了一遍),所以想下還是用簡(jiǎn)書記錄下來罷瓮栗。

為什么使用 Sqoop1 而不是 Sqoop2费奸?

這個(gè)进陡,很尷尬,Hue 3.10 + Sqoop2 + SSL 一直沒有調(diào)通换况,Sqoop Transfer 界面一直報(bào):Sqoop error: Could not get connectors戈二,避免耽誤進(jìn)度,所以沒有使用腾供。

準(zhǔn)備工作

有兩塊需要注意鲜滩,一個(gè)是 Mysql Connector Jar 需要在 Oozie / Sqoop 的對(duì)應(yīng)庫目錄下存在徙硅,一個(gè)是 Yarn 相關(guān)的內(nèi)存資源配置,否則提交任務(wù)后會(huì)一直進(jìn)行 heartbeat须肆。

A. Mysql Connector Jar 部署

Step by Step 實(shí)現(xiàn)基于 Cloudera 5.8.2 的企業(yè)級(jí)安全大數(shù)據(jù)平臺(tái) - 基礎(chǔ)部署 一文所述桩皿,我們?cè)诓渴?Oozie 服務(wù)的時(shí)候已經(jīng)涉及部分:

pssh -h list_agents "sudo mkdir -p /opt/cloudera/parcels/CDH-5.8.2-1.cdh5.8.2.p0.3/lib/hive/lib/ /opt/cloudera/parcels/CDH-5.8.2-1.cdh5.8.2.p0.3/lib/oozie/lib/ /var/lib/oozie" 

pssh -h list_agents "sudo cp /tmp/mysql-connector-java-5.1.34.jar /opt/cloudera/parcels/CDH-5.8.2-1.cdh5.8.2.p0.3/lib/oozie/lib/" 

pssh -h list_agents "sudo cp /tmp/mysql-connector-java-5.1.34.jar /var/lib/oozie"

我們還需要在另外幾個(gè)目錄進(jìn)行部署:

pssh -h list_agents "sudo cp /tmp/mysql-connector-java-5.1.34.jar /home/opt/cloudera/parcels/CDH-5.8.2-1.cdh5.8.2.p0.3/lib/oozie/libtools"

pssh -h list_agents "sudo cp /tmp/mysql-connector-java-5.1.34.jar /var/lib/oozie/mysql-connector-java-5.1.34.jar"

pssh -h list_agents "sudo cp /tmp/mysql-connector-java-5.1.34.jar /home/opt/cloudera/parcels/CDH-5.8.2-1.cdh5.8.2.p0.3/lib/sqoop/lib"

pssh -h list_agents "sudo cp /tmp/mysql-connector-java-5.1.34.jar /var/lib/sqoop"

另外也需要在 HDFS 的 Oozie sharlib 目錄下存在該 jar泄隔,其中 TIMESTAMP 是 Oozie 啟動(dòng)時(shí)的時(shí)間戳(Date 格式)佛嬉,一般類似 20170318104137

hadoop fs -put mysql-connector-java-5.1.34.jar /user/oozie/share/lib/lib_${TIMESTAMP}/sqoop/

最后我們需要重啟 Sqoop 。

B. 合理配置 YARN 內(nèi)存

如果對(duì)以下配置不進(jìn)行合理配置(比如使用 Cloudera 的默認(rèn)配置)赡盘,會(huì)出現(xiàn) issue: https://community.cloudera.com/t5/Batch-Processing-and-Workflow/Oozie-sqoop-action-in-CDH-5-2-Heart-beat-issue/td-p/22181,所以我們需要修改并且加大它們:

  <property>
    <name>yarn.nodemanager.resource.memory-mb</name>
    <value>4096</value>
  </property>
  <property>
    <name>yarn.scheduler.maximum-allocation-mb</name>
    <value>4096</value>
  </property>

這塊不需要手動(dòng)修改配置文件钝腺,可以在 Cloudera Manager Web Console -> Cluster -> YARN -> Configuration 中設(shè)置赞厕。

修改完上述配置后皿桑,我們需要重啟 YARN毫目。

操作步驟

我們先拋開之前部署的 Kerberos + SSL 來說蔬啡,不考慮這幾個(gè)安全組件,怎么在基礎(chǔ)裸集群內(nèi) run 起來 Sqoop1 作業(yè)镀虐。和從冰箱拿香蕉一樣箱蟆,開冰箱 -> 拿香蕉 -> 關(guān)冰箱,真的只要 3 步刮便。

Step1. 建立測(cè)試用數(shù)據(jù)庫

創(chuàng)建 MySQL 的步驟這里不闡述空猜,各個(gè)網(wǎng)站隨便搜,注意 CentOS 7.2 默認(rèn)是 MariaDB恨旱,請(qǐng)參考類似文檔辈毯。

Step2. 創(chuàng)建測(cè)試工作流

打開 Hue 的 Web 界面,進(jìn)入 Workflows -> Editors -> Workflows 搜贤,點(diǎn)擊 Create 按鈕。從上方的標(biāo)簽中選擇 Sqoop1 拖入 Drop your action here 的位置仪芒,在 Sqoop command 中輸入:

import  --connect jdbc:mysql://${MYSQL_HOSTNAME}:${MYSQL_PORT}/${DN_NAME} --table ${TABLE_NAME} --target-dir hdfs://${NAMENODE_HOSTNAME}:${NAMENODE_PORT}/${PATH_TARGET} -m 1 --username ${USERNAME} --password ${PASSWORD}

命令中的變量請(qǐng)自行替換唁影。完成后保存,點(diǎn)擊 Save 按鈕 桌硫。

Step3. 啟動(dòng)工作流

點(diǎn)擊 Submit 按鈕夭咬,提交作業(yè)。

注意: target-dir 必須本身不存在铆隘,否則會(huì)報(bào)錯(cuò)卓舵。

小結(jié)

本文介紹了如何在 Hue 3.10 中提交 Sqoop1 作業(yè),以及如何避免常見問題膀钠。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末掏湾,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子肿嘲,更是在濱河造成了極大的恐慌融击,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,591評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件雳窟,死亡現(xiàn)場(chǎng)離奇詭異尊浪,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)封救,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,448評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門拇涤,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人誉结,你說我怎么就攤上這事鹅士。” “怎么了惩坑?”我有些...
    開封第一講書人閱讀 162,823評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵掉盅,是天一觀的道長(zhǎng)也拜。 經(jīng)常有香客問我,道長(zhǎng)趾痘,這世上最難降的妖魔是什么慢哈? 我笑而不...
    開封第一講書人閱讀 58,204評(píng)論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮扼脐,結(jié)果婚禮上岸军,老公的妹妹穿的比我還像新娘。我一直安慰自己瓦侮,他們只是感情好艰赞,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,228評(píng)論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著肚吏,像睡著了一般方妖。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上罚攀,一...
    開封第一講書人閱讀 51,190評(píng)論 1 299
  • 那天党觅,我揣著相機(jī)與錄音,去河邊找鬼斋泄。 笑死杯瞻,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的炫掐。 我是一名探鬼主播魁莉,決...
    沈念sama閱讀 40,078評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼募胃!你這毒婦竟也來了旗唁?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,923評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤痹束,失蹤者是張志新(化名)和其女友劉穎检疫,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體祷嘶,經(jīng)...
    沈念sama閱讀 45,334評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡屎媳,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,550評(píng)論 2 333
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了论巍。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片剿牺。...
    茶點(diǎn)故事閱讀 39,727評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖环壤,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情钞诡,我是刑警寧澤郑现,帶...
    沈念sama閱讀 35,428評(píng)論 5 343
  • 正文 年R本政府宣布湃崩,位于F島的核電站,受9級(jí)特大地震影響接箫,放射性物質(zhì)發(fā)生泄漏攒读。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,022評(píng)論 3 326
  • 文/蒙蒙 一辛友、第九天 我趴在偏房一處隱蔽的房頂上張望薄扁。 院中可真熱鬧,春花似錦废累、人聲如沸邓梅。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,672評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽日缨。三九已至,卻和暖如春掖看,著一層夾襖步出監(jiān)牢的瞬間匣距,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,826評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工哎壳, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留毅待,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,734評(píng)論 2 368
  • 正文 我出身青樓归榕,卻偏偏與公主長(zhǎng)得像尸红,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子蹲坷,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,619評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容