【DataX】

DataX 是阿里巴巴開源的一個異構數據源離線同步工具梁肿,致力于實現包括關系型數據庫(MySQL、Oracle等)觅彰、HDFS吩蔑、Hive、ODPS填抬、HBase烛芬、FTP等各種異構數據源之間穩(wěn)定高效的數據同步功能。
源碼地址:https://github.com/alibaba/DataX

DataX部署

1)下載DataX安裝包并上傳到/opt/software
下載地址:http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz
2)解壓datax.tar.gz到/opt/module
tar -zxvf datax.tar.gz -C /opt/module/
3)自檢,執(zhí)行如下命令
python /opt/module/datax/bin/datax.py /opt/module/datax/job/job.json

DataX任務提交命令

DataX的使用十分簡單赘娄,用戶只需根據自己同步數據的數據源和目的地選擇相應的Reader和Writer仆潮,并將Reader和Writer的信息配置在一個json文件中,然后執(zhí)行如下命令提交數據同步任務即可擅憔。
python /opt/module/datax/bin/datax.py /opt/module/datax/job/your-job.json

可以使用如下命名查看DataX配置文件模板鸵闪。
python bin/datax.py -r mysqlreader -w hdfswriter

配置文件模板如下,json最外層是一個job暑诸,job包含setting和content兩部分蚌讼,其中setting用于對整個job進行配置,content用戶配置數據源和目的地个榕。

image.png

Reader和Writer的具體參數可參考官方文檔篡石,地址如下:
https://github.com/alibaba/DataX/blob/master/README.md

image.png
同步MySQL數據到HDFS案例

案例要求:同步gmall數據庫中base_province表數據到HDFS的/base_province目錄
需求分析:要實現該功能,需選用MySQLReader和HDFSWriter西采,MySQLReader具有兩種模式分別是TableMode和QuerySQLMode凰萨,前者使用table,column械馆,where等屬性聲明需要同步的數據胖眷;后者使用一條SQL查詢語句聲明需要同步的數據。

下面分別使用兩種模式進行演示霹崎。

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末珊搀,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子尾菇,更是在濱河造成了極大的恐慌境析,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件派诬,死亡現場離奇詭異劳淆,居然都是意外死亡,警方通過查閱死者的電腦和手機默赂,發(fā)現死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門沛鸵,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人缆八,你說我怎么就攤上這事谒臼。” “怎么了耀里?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵蜈缤,是天一觀的道長。 經常有香客問我冯挎,道長底哥,這世上最難降的妖魔是什么咙鞍? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮趾徽,結果婚禮上续滋,老公的妹妹穿的比我還像新娘。我一直安慰自己孵奶,他們只是感情好疲酌,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著了袁,像睡著了一般朗恳。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上载绿,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天粥诫,我揣著相機與錄音,去河邊找鬼崭庸。 笑死怀浆,一個胖子當著我的面吹牛,可吹牛的內容都是我干的怕享。 我是一名探鬼主播执赡,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼函筋!你這毒婦竟也來了沙合?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤驻呐,失蹤者是張志新(化名)和其女友劉穎灌诅,沒想到半個月后芳来,有當地人在樹林里發(fā)現了一具尸體含末,經...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年即舌,在試婚紗的時候發(fā)現自己被綠了佣盒。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡顽聂,死狀恐怖肥惭,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情紊搪,我是刑警寧澤蜜葱,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站耀石,受9級特大地震影響牵囤,放射性物質發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一揭鳞、第九天 我趴在偏房一處隱蔽的房頂上張望炕贵。 院中可真熱鬧,春花似錦野崇、人聲如沸称开。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽鳖轰。三九已至,卻和暖如春督禽,著一層夾襖步出監(jiān)牢的瞬間脆霎,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工狈惫, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留睛蛛,地道東北人。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓胧谈,卻偏偏與公主長得像忆肾,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子菱肖,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內容