為什么 ETL 很困難?

工具繁多

從 DataStage到Kettle, ETL 工具覆蓋了商業(yè)化領域和開源領域, 價格從幾十萬到免費,起碼有幾十種選擇钮莲。
有人要說了,選擇多不是一件好事么?如果再早幾年,我會同意這是好事,可到現(xiàn)在,我要說 NO!
前面關于決策思維的博文提到一個論點:相比于普通人做出決策,專家是會直接給一種可行方案還是羅列眾多方案類比優(yōu)劣?
答案是前者,也是我反對選擇眾多是好事這一論點的依據(jù)之一太雨。

那么選擇多有什么壞處?

基礎方案混雜派阱。各公司方案不同,甚至一個公司 ETL 環(huán)節(jié)也采用不同工具及架構(gòu),人才無法公用,維護成本高。
數(shù)據(jù)項目失敗案例遠多于成功案例, 項目選型越復雜成功概率越低。大量公司做 BI柔滔、做大數(shù)據(jù),甚至在沒有人懂的情況下招人開工!事實上在數(shù)據(jù)領域,熟手都清楚一個現(xiàn)象,沒有成功案例的人很難做成數(shù)據(jù)項目。很殘忍的現(xiàn)實,但也讓那些盲目投入資源跟風做項目的公司考慮冷靜下來了嘹履。
抬高實施門檻。現(xiàn)在大家都想做數(shù)據(jù),進入大數(shù)據(jù)領域,尤其是有很多不具備該領域經(jīng)驗的公司想要做债热。那么實施前首先就是選型了,如果從三個產(chǎn)品選一個來做還可行的話,那么要從三十個產(chǎn)品中選型,這個工作本身就阻礙了數(shù)據(jù)項目的開展!

GUI工具

說到這里反對的朋友更多了,GUI 所見即所得,降低使用門檻,好處一頁都寫不完,作為一名數(shù)據(jù)領域從業(yè)者,我決然反對,自己都能感覺到火藥味砾嫉。為了論證我的觀點,這里要羅列ETL領域那些GUI的罪證了。

ETL 工具的六大問題

  • 工具太大了,卡卡卡!我不是說 SSIS 之類,也不是說 Kettle 相關,我說的是他們所有人……
  • 好用的太貴, 便宜的不好用!
  • 組件式的拖拉開發(fā),性能真的沒法起來!尤其是那些依靠組件解決數(shù)據(jù)變化提取的兄弟們,你們想多了窒篱。
  • 我需要一包廁紙而已,你非要給我整個超市焕刮。在我蹲之前非得找遍整個超市!大家對比下里面的功能自己使用的比率。
  • 說 GUI 簡單好用的,我強烈反對墙杯。GUI 好調(diào)試么?映射過程報錯了大家要怎么辦?檢查源檢查目標也就算了,連映射環(huán)節(jié)都要排查配并。除了自己設定的格式類型,還要考慮工具環(huán)節(jié)自己的轉(zhuǎn)換類型,這不是增加負擔么?
  • 部署,我都不想說部署了。一千個任務下來,ETL 工具別談部署了!這時候有同學開始研究調(diào)度,有些關注數(shù)據(jù)質(zhì)量,任務數(shù)量起來,想什么都是多的,保佑這混亂情況別出岔子就阿彌陀佛了高镐。

ETL 工具阻礙了設計

直接用工具拉數(shù)據(jù)的項目,認真找找有沒有架構(gòu)設計,有沒有項目文檔,有沒有擴展性考慮,性能考慮?或者簡單點,這項目換人可能接手下來么?
數(shù)據(jù)項目是團隊項目,ETL 工具是個人化工具溉旋。如果多個成員不能無縫接替工作,對不起,我認為這不是數(shù)據(jù)項目。哦不對,不算是一個項目嫉髓。
組件報錯是工具問題,轉(zhuǎn)換異常跟自己沒關系观腊。工具的 bug 和我真沒關系,我項目做得好好的,ETL 工具崩潰了管我什么事?遇到這種情況不說我也知道做法,崩潰了再起來跑一跑嘛,運氣好數(shù)據(jù)就跑出來了。至于數(shù)據(jù)質(zhì)量管理是什么這樣的問題,就別問出來了岩喷。

這里有關于 ETL 的一切
這里有直接上手的 ETL 方案
這里有十年數(shù)據(jù)解決方案的結(jié)晶

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末恕沫,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子纱意,更是在濱河造成了極大的恐慌婶溯,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,496評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件偷霉,死亡現(xiàn)場離奇詭異迄委,居然都是意外死亡,警方通過查閱死者的電腦和手機类少,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,187評論 3 385
  • 文/潘曉璐 我一進店門叙身,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人硫狞,你說我怎么就攤上這事信轿。” “怎么了残吩?”我有些...
    開封第一講書人閱讀 157,091評論 0 348
  • 文/不壞的土叔 我叫張陵财忽,是天一觀的道長。 經(jīng)常有香客問我泣侮,道長即彪,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,458評論 1 283
  • 正文 為了忘掉前任活尊,我火速辦了婚禮隶校,結(jié)果婚禮上漏益,老公的妹妹穿的比我還像新娘。我一直安慰自己深胳,他們只是感情好绰疤,可當我...
    茶點故事閱讀 65,542評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著稠屠,像睡著了一般峦睡。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上权埠,一...
    開封第一講書人閱讀 49,802評論 1 290
  • 那天榨了,我揣著相機與錄音,去河邊找鬼攘蔽。 笑死龙屉,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的满俗。 我是一名探鬼主播转捕,決...
    沈念sama閱讀 38,945評論 3 407
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼唆垃!你這毒婦竟也來了五芝?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,709評論 0 266
  • 序言:老撾萬榮一對情侶失蹤辕万,失蹤者是張志新(化名)和其女友劉穎枢步,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體渐尿,經(jīng)...
    沈念sama閱讀 44,158評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡醉途,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,502評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了砖茸。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片隘擎。...
    茶點故事閱讀 38,637評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖凉夯,靈堂內(nèi)的尸體忽然破棺而出货葬,到底是詐尸還是另有隱情,我是刑警寧澤劲够,帶...
    沈念sama閱讀 34,300評論 4 329
  • 正文 年R本政府宣布宝惰,位于F島的核電站,受9級特大地震影響再沧,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜尊残,卻給世界環(huán)境...
    茶點故事閱讀 39,911評論 3 313
  • 文/蒙蒙 一炒瘸、第九天 我趴在偏房一處隱蔽的房頂上張望淤堵。 院中可真熱鬧,春花似錦顷扩、人聲如沸拐邪。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,744評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽扎阶。三九已至,卻和暖如春婶芭,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,982評論 1 266
  • 我被黑心中介騙來泰國打工叶沛, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留硫眯,地道東北人。 一個月前我還...
    沈念sama閱讀 46,344評論 2 360
  • 正文 我出身青樓呵哨,卻偏偏與公主長得像赁濒,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子孟害,可洞房花燭夜當晚...
    茶點故事閱讀 43,500評論 2 348

推薦閱讀更多精彩內(nèi)容