DataX 的配置及使用

DataX 是阿里巴巴集團內(nèi)被廣泛使用的離線數(shù)據(jù)同步工具/平臺,實現(xiàn)包括 MySQL、SQL Server琢歇、Oracle巴帮、PostgreSQL、HDFS暇番、Hive、HBase、OTS锈津、ODPS 等各種異構(gòu)數(shù)據(jù)源之間高效的數(shù)據(jù)同步功能。

其官網(wǎng)地址:https://github.com/alibaba/DataX

快速上手步驟

1.下載 DataX:DataX 下載地址

2.配置任務(wù) Json

下載的 DataX 的目錄:

配置 datax/job 文件夾下的 Json:

{
    "job":{
        "content":[
            {
                "reader":{
                    "name":"mysqlreader",
                    "parameter":{
                        "column":[
                            "id",
                            "resource",
                            "remark"
                        ],
                        "connection":[
                            {
                                "jdbcUrl":[
                                    "jdbc:mysql://127.0.0.1:3306/test?characterEncoding=utf8"
                                ],
                                "table":[
                                    "school_menu"
                                ]
                            }
                        ],
                        "password":"123456",
                        "username":"root"
                    }
                },
                "writer":{
                    "name":"mysqlwriter",
                    "parameter":{
                        "column":[
                            "id",
                            "resource",
                            "remark"
                        ],
                        "connection":[
                            {
                                "jdbc:mysql://127.0.0.1:3306/test?characterEncoding=utf8",
                                "table":[
                                    "school_test"
                                ]
                            }
                        ],
                        "password":"123456",
                        "username":"root"
                    }
                }
            }
        ],
        "setting":{
            "speed":{
                "channel":"1"
            }
        }
    }
}

任務(wù) Json 由三部分組成凉蜂,分別是讀琼梆,寫和通用配置性誉。

Reader 部分常用參數(shù):
參數(shù)名 解釋 備注
name 與要讀取的數(shù)據(jù)庫一致 字符串
jdbcUrl 數(shù)據(jù)庫鏈接 數(shù)組,會自動選擇一個合法的鏈接茎杂,可以填寫連接附件控制信息
username 數(shù)據(jù)庫用戶名 字符串错览,數(shù)據(jù)庫的用戶名
password 數(shù)據(jù)庫密碼 字符串,數(shù)據(jù)庫的密碼
table 要同步的表名 數(shù)組煌往,需保證表結(jié)構(gòu)一致
column 要同步的列名 數(shù)組
where 選取的條件 字符串
querySql 自定義查詢語句 會自動忽略上述的同步條件
Writer 部分常用參數(shù):
參數(shù)名 解釋 備注
name 與要讀取的數(shù)據(jù)庫一致 字符串
jdbcUrl 數(shù)據(jù)庫鏈接 字符串倾哺,可以填寫連接附件控制信息
username 數(shù)據(jù)庫用戶名 字符串,數(shù)據(jù)庫的用戶名
password 數(shù)據(jù)庫密碼 字符串刽脖,數(shù)據(jù)庫的密碼
table 要同步的表名 數(shù)組羞海,需保證表結(jié)構(gòu)一致
column 列名可以不對應(yīng),但是類型和總的個數(shù)要一致 數(shù)組曾棕,需保證表結(jié)構(gòu)一致
preSql 寫入前執(zhí)行的語句 數(shù)組扣猫,比如清空表等
postSql 寫入后執(zhí)行的語句 數(shù)組
writeMode 寫入方式,默認為insert insert/replace/update
  • job.setting.speed (流量控制)
    • Job 支持用戶對速度的自定義控制翘地,channel 的值可以控制同步時的并發(fā)數(shù)申尤,byte 的值可以控制同步時的速度
  • job.setting.errorLimit (臟數(shù)據(jù)控制)
    • Job 支持用戶對于臟數(shù)據(jù)的自定義監(jiān)控和告警,包括對臟數(shù)據(jù)最大記錄數(shù)閾值(record 值)或者臟數(shù)據(jù)占比閾值(percentage 值)衙耕,當 Job 傳輸過程出現(xiàn)的臟數(shù)據(jù)大于用戶指定的數(shù)量/百分比昧穿,DataX Job 報錯退出。

命令行 cd 到 datax/bin 目錄下橙喘,執(zhí)行 python datax.py ../job/mysqltomysql.json

然后看到 school_test 表的數(shù)據(jù):

到此已經(jīng)成功了时鸵。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市厅瞎,隨后出現(xiàn)的幾起案子饰潜,更是在濱河造成了極大的恐慌,老刑警劉巖和簸,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件彭雾,死亡現(xiàn)場離奇詭異,居然都是意外死亡锁保,警方通過查閱死者的電腦和手機薯酝,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來爽柒,“玉大人吴菠,你說我怎么就攤上這事『拼澹” “怎么了做葵?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長心墅。 經(jīng)常有香客問我蜂挪,道長重挑,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任棠涮,我火速辦了婚禮,結(jié)果婚禮上刺覆,老公的妹妹穿的比我還像新娘严肪。我一直安慰自己,他們只是感情好谦屑,可當我...
    茶點故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布驳糯。 她就那樣靜靜地躺著,像睡著了一般氢橙。 火紅的嫁衣襯著肌膚如雪酝枢。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天悍手,我揣著相機與錄音帘睦,去河邊找鬼。 笑死坦康,一個胖子當著我的面吹牛竣付,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播滞欠,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼古胆,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了筛璧?” 一聲冷哼從身側(cè)響起逸绎,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎夭谤,沒想到半個月后棺牧,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡沮翔,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年陨帆,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片采蚀。...
    茶點故事閱讀 38,137評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡疲牵,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出榆鼠,到底是詐尸還是另有隱情纲爸,我是刑警寧澤,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布妆够,位于F島的核電站识啦,受9級特大地震影響负蚊,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜颓哮,卻給世界環(huán)境...
    茶點故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一家妆、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧冕茅,春花似錦伤极、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至乍楚,卻和暖如春当编,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背徒溪。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工忿偷, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人词渤。 一個月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓牵舱,卻偏偏與公主長得像,于是被迫代替她去往敵國和親缺虐。 傳聞我的和親對象是個殘疾皇子芜壁,可洞房花燭夜當晚...
    茶點故事閱讀 42,901評論 2 345