溫故知新:DataX使用記錄

本文為學習筆記界酒,會隨著學習深入持續(xù)更新蜒程,僅供參考
場景:mysql到hdfs;hdfs到doris
1岖圈、mysql到hdfs參考配置文件

{
  "job": {
    "setting": {
      "speed": {
        "channel": 3
      }
    },
    "content": [
      {
        "reader": {
          "name": "mysqlreader",
          "parameter": {
            "username": "${username}",
            "password": "${password}",
            "column": [
              "id"
            ],
            "connection": [
              {
                "table": [
                  "${table}"
                ],
                "jdbcUrl": [
                  "jdbc:MySQL://${host}:3306/${database}?useSSL=false&allowPublicKeyRetrieval=true"
                ]
              }
            ]
          }
        },
        "writer": {
          "name": "hdfswriter",
          "parameter": {
            "defaultFS": "hdfs://${hdfs_host}:${hdfs_port}",
            "fileType": "text",
            "path": "${path}",
            "fileName": "${table}",
            "column": [
              {"name": "id", "type": "bigint"}
            ],
            "writeMode":"append",
            "fieldDelimiter": "\t",
            "compress": "gzip",
            "hadoopConfig": {
              "dfs.replication": "1"
            }
          }
        }
      }
    ]
  }
}

2讹语、hdfs到doris參考配置文件

{
  "job": {
    "setting": {
      "speed": {
        "channel": 3
      }
    },
    "content": [
      {
        "reader": {
          "name": "hdfsreader",
          "parameter": {
            "path": "${hive_path}/${hive_table}/dt=${day}",
            "defaultFS": "hdfs://${hdfs_host}:${hdfs_port}",
            "fileType": "orc",
            "column": [
              {
                "index": 0,
                "name": "agg_time",
                "type": "string"
              },
              {
                "name": "dt",
                "type": "string",
                "value": "${day}"
              }
            ],
            "fieldDelimiter": "\t",
            "encoding": "UTF-8",
            "nullFormat": "\\N"
          }
        },
        "writer": {
          "name": "doriswriter",
          "parameter": {
            "loadUrl": [
              "${doris_host}:8030"
            ],
            "column": [
              "agg_time",
              "time_day"
            ],
            "username": "${doris_user}",
            "password": "${doris_password}",
            "postSql": [],
            "preSql": [],
            "flushInterval": 30000,
            "connection": [
              {
                "jdbcUrl": "jdbc:mysql://${doris_host}:9030/${doris_db}",
                "table": [
                  "${doris_table}"
                ],
                "selectedDatabase": "${doris_db}"
              }
            ]
          }
        }
      }
    ]
  }
}

注意:
1钙皮、這里需要提取hive的分區(qū)時間(dt)作為doris的一個時間字段(time_day)蜂科,處理方式為傳入指定日期的時間,比如今天處理昨天的數(shù)據(jù)短条,這個時間就是昨天
2导匣、doris的loadUrl的端口是fe的端口,下邊的jdbcUrl的端口才是數(shù)據(jù)庫的端口
3茸时、這里的數(shù)據(jù)采用的追加的方式
4贡定、json的格式要正確否則會報錯
5、如果官方給的jar包可都,缺少一些reader或writer就需要改為源碼安裝


參考文件
1缓待、DataX源碼
2、Dolphinscheduler調度Datax任務讀取Hive分區(qū)表案例
3渠牲、Dorsi官網
4旋炒、Doris寫入時報Content-Length header already present異常處理

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市签杈,隨后出現(xiàn)的幾起案子瘫镇,更是在濱河造成了極大的恐慌,老刑警劉巖答姥,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件铣除,死亡現(xiàn)場離奇詭異,居然都是意外死亡鹦付,警方通過查閱死者的電腦和手機尚粘,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來敲长,“玉大人郎嫁,你說我怎么就攤上這事互捌。” “怎么了行剂?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵秕噪,是天一觀的道長。 經常有香客問我厚宰,道長腌巾,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任铲觉,我火速辦了婚禮澈蝙,結果婚禮上,老公的妹妹穿的比我還像新娘撵幽。我一直安慰自己灯荧,他們只是感情好,可當我...
    茶點故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布盐杂。 她就那樣靜靜地躺著逗载,像睡著了一般。 火紅的嫁衣襯著肌膚如雪链烈。 梳的紋絲不亂的頭發(fā)上厉斟,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天,我揣著相機與錄音强衡,去河邊找鬼擦秽。 笑死,一個胖子當著我的面吹牛漩勤,可吹牛的內容都是我干的感挥。 我是一名探鬼主播,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼越败,長吁一口氣:“原來是場噩夢啊……” “哼触幼!你這毒婦竟也來了?” 一聲冷哼從身側響起眉尸,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤域蜗,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后噪猾,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體霉祸,經...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年袱蜡,在試婚紗的時候發(fā)現(xiàn)自己被綠了丝蹭。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,577評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡坪蚁,死狀恐怖奔穿,靈堂內的尸體忽然破棺而出镜沽,到底是詐尸還是另有隱情,我是刑警寧澤贱田,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布缅茉,位于F島的核電站,受9級特大地震影響男摧,放射性物質發(fā)生泄漏蔬墩。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一耗拓、第九天 我趴在偏房一處隱蔽的房頂上張望拇颅。 院中可真熱鬧,春花似錦乔询、人聲如沸樟插。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽黄锤。三九已至,卻和暖如春们妥,著一層夾襖步出監(jiān)牢的瞬間猜扮,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工监婶, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人齿桃。 一個月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓惑惶,卻偏偏與公主長得像,于是被迫代替她去往敵國和親短纵。 傳聞我的和親對象是個殘疾皇子带污,可洞房花燭夜當晚...
    茶點故事閱讀 43,452評論 2 348

推薦閱讀更多精彩內容

  • 本文為學習筆記,會隨著學習深入持續(xù)更新香到,僅供參考 一鱼冀、datax干嘛的和之前的seatunnel使用上有什么區(qū)別 ...
    燦爛的GL閱讀 1,729評論 0 0
  • 本文為學習筆記,會隨著學習深入持續(xù)更新悠就,僅供參考一千绪、hive是干什么的建立在hadoop上的數(shù)倉系統(tǒng),可以將存儲在...
    燦爛的GL閱讀 452評論 0 0
  • 第1章 DataX簡介 1.1 DataX概述 DataX 是阿里巴巴開源的一個異構數(shù)據(jù)源離線同步工具梗脾,致力于實現(xiàn)...
    Yobhel閱讀 702評論 0 0
  • 1.概述 Apache Doris 是一個基于MPP架構的高性能實時分析 OLAP 引擎荸型,以其極快的速度和易用性而...
    小波同學閱讀 5,727評論 1 38
  • DataX3.0離線同步工具介紹 一. DataX3.0概覽 ?DataX 是一個異構數(shù)據(jù)源離線同步工具,致力于實...
    香山上的麻雀閱讀 68,475評論 7 40