ETL測試-介紹

翻譯自:https://www.tutorialspoint.com/etl_testing/etl_testing_introduction.htm

在數(shù)據(jù)倉庫中的數(shù)據(jù)是用一個ETL(抽取垫竞,轉(zhuǎn)換蛙吏,加載)工具加載的挥等。如字面意思扬虚,它需要下面的操作:

  • 從事務(wù)系統(tǒng)像Oracle,MySql或者其他的關(guān)系型數(shù)據(jù)庫抽取數(shù)據(jù)
  • 通過數(shù)據(jù)清理操作轉(zhuǎn)換數(shù)據(jù)
  • 加載數(shù)據(jù)到OLAP數(shù)據(jù)倉庫

你也可以是用ETL工具從平面文件中像spreadsheets和CSV文件抽取數(shù)據(jù),然后加載它到OLAP數(shù)據(jù)倉庫中方便分析和報告咸包。讓我們舉一個例子來更好的理解它。

例子

讓我們假設(shè)有一個制造公司有銷售战惊,人力資源缩挑,材料管理但两,EWM等多個部門,所有這些部門都有獨立的數(shù)據(jù)庫供置,用于維護(hù)信息的工作谨湘,每個數(shù)據(jù)庫都有不同的技術(shù),landscape芥丧,表格名稱紧阔,列等。現(xiàn)在娄柳,如果公司想要分析歷史數(shù)據(jù)并生成報告寓辱,那么這些數(shù)據(jù)源的所有數(shù)據(jù)都應(yīng)該被提取并加載到數(shù)據(jù)倉庫中以將其保存以進(jìn)行分析工作艘绍。

ETL工具從所有這些異構(gòu)數(shù)據(jù)源中提取數(shù)據(jù)赤拒,轉(zhuǎn)換數(shù)據(jù)(如應(yīng)用計算,連接字段诱鞠,密鑰挎挖,刪除不正確的數(shù)據(jù)字段等),并將其加載到數(shù)據(jù)倉庫中航夺。之后蕉朵,您可以使用各種商業(yè)智能(BI)工具,使用此數(shù)據(jù)生成有意義的報告阳掐,儀表板和可視化始衅。

ETL和BI工具之間的區(qū)別

一個ETL工具常常從不同的數(shù)據(jù)源抽取數(shù)據(jù),轉(zhuǎn)換數(shù)據(jù)缭保,然后加載到DW系統(tǒng)汛闸;然而一個BI的工具常常用于為最終用戶生成交互式和特別的報告,高級管理儀表盤艺骂,月度诸老,季度和年度董事會議的數(shù)據(jù)可視化。

最常見的ETL工具包括-SAP BO Data Services (BODS), Informatica – Power Center, Microsoft – SSIS, Oracle Data Integrator ODI, Talend Open Studio, Clover ETL Open source等等钳恕。

一些流行的BI工具包括? SAP Business Objects, SAP Lumira, IBM Cognos, JasperSoft, Microsoft BI Platform, Tableau, Oracle Business Intelligence Enterprise Edition等等别伏。

ETL流程

讓我們更詳細(xì)地討論下一些ETL程序關(guān)鍵步驟

抽取數(shù)據(jù)

它涉及到從不同的異構(gòu)數(shù)據(jù)源中抽取數(shù)據(jù)蹄衷。交易系統(tǒng)的數(shù)據(jù)抽取根據(jù)需求和使用的ETL工具而異。它通常通過在營業(yè)時間運(yùn)行定好的任務(wù)厘肮,像在晚上或者在周末的運(yùn)行任務(wù)愧口。

image.png

轉(zhuǎn)換數(shù)據(jù)

它涉及將數(shù)據(jù)轉(zhuǎn)換成可以容易的加載到DW系統(tǒng)中的合適的格式。數(shù)據(jù)轉(zhuǎn)換在數(shù)據(jù)上的應(yīng)用計算类茂,連接和定義主鍵和外鍵调卑。例如,如果想要的總收入百分比數(shù)據(jù)不再數(shù)據(jù)庫中大咱,你可以用在轉(zhuǎn)換中用百分比公式并且加載數(shù)據(jù)恬涧。同樣,如果有姓和名在不同的列中碴巾,然后你可以在加載數(shù)據(jù)前用一個連接操作溯捆。一些數(shù)據(jù)不需要任何轉(zhuǎn)換,這些數(shù)據(jù)稱為直接移動或通過數(shù)據(jù)厦瓢。

數(shù)據(jù)轉(zhuǎn)換也涉及數(shù)據(jù)修正和清理提揍,移除不正確的數(shù)據(jù),不完整的數(shù)據(jù)形成煮仇,以及修復(fù)數(shù)據(jù)錯誤劳跃。它也包括數(shù)據(jù)的完整性和格式化不兼容的數(shù)據(jù),然后加載到DW系統(tǒng)浙垫。

加載數(shù)據(jù)到DW系統(tǒng)

它涉及加載數(shù)據(jù)到DW系統(tǒng)進(jìn)行分析報告和信息刨仑。目標(biāo)系統(tǒng)可以是一個簡單分隔的平面文件或者數(shù)據(jù)倉庫。

ETL工具功能

一個典型的基于ETL的數(shù)據(jù)倉庫使用階段區(qū)域夹姥,數(shù)據(jù)整合以及入口層來表現(xiàn)它的功能杉武。它通常是3層結(jié)構(gòu)。

  • Staging Layer - 分級層或分級數(shù)據(jù)庫用于存儲從不同源數(shù)據(jù)系統(tǒng)抽取的數(shù)據(jù)
  • Data Integration Layer - 數(shù)據(jù)集成層從分級層轉(zhuǎn)換并且將數(shù)據(jù)移動到數(shù)據(jù)庫辙售,這些數(shù)據(jù)排列成層次結(jié)構(gòu)轻抱,經(jīng)常稱為** dimensions(維度),以及facts(事實)和aggregate facts(聚合事實)旦部。在DW系統(tǒng)中事實表和維度表的組合稱為schema**(模式)祈搜。
  • Access Layer - 接入層通常被最終用戶使用于分析報告和信息。

下面插圖展示了這三層是如何互相交互的士八。

image.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末容燕,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子曹铃,更是在濱河造成了極大的恐慌缰趋,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,198評論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異秘血,居然都是意外死亡味抖,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評論 3 398
  • 文/潘曉璐 我一進(jìn)店門灰粮,熙熙樓的掌柜王于貴愁眉苦臉地迎上來仔涩,“玉大人,你說我怎么就攤上這事粘舟∪壑” “怎么了?”我有些...
    開封第一講書人閱讀 167,643評論 0 360
  • 文/不壞的土叔 我叫張陵柑肴,是天一觀的道長霞揉。 經(jīng)常有香客問我,道長晰骑,這世上最難降的妖魔是什么适秩? 我笑而不...
    開封第一講書人閱讀 59,495評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮硕舆,結(jié)果婚禮上秽荞,老公的妹妹穿的比我還像新娘。我一直安慰自己抚官,他們只是感情好扬跋,可當(dāng)我...
    茶點故事閱讀 68,502評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著凌节,像睡著了一般钦听。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上刊咳,一...
    開封第一講書人閱讀 52,156評論 1 308
  • 那天彪见,我揣著相機(jī)與錄音儡司,去河邊找鬼娱挨。 笑死,一個胖子當(dāng)著我的面吹牛捕犬,可吹牛的內(nèi)容都是我干的跷坝。 我是一名探鬼主播,決...
    沈念sama閱讀 40,743評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼碉碉,長吁一口氣:“原來是場噩夢啊……” “哼柴钻!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起垢粮,我...
    開封第一講書人閱讀 39,659評論 0 276
  • 序言:老撾萬榮一對情侶失蹤贴届,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體毫蚓,經(jīng)...
    沈念sama閱讀 46,200評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡占键,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,282評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了元潘。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片畔乙。...
    茶點故事閱讀 40,424評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖翩概,靈堂內(nèi)的尸體忽然破棺而出牲距,到底是詐尸還是另有隱情,我是刑警寧澤钥庇,帶...
    沈念sama閱讀 36,107評論 5 349
  • 正文 年R本政府宣布牍鞠,位于F島的核電站,受9級特大地震影響评姨,放射性物質(zhì)發(fā)生泄漏皮服。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,789評論 3 333
  • 文/蒙蒙 一参咙、第九天 我趴在偏房一處隱蔽的房頂上張望龄广。 院中可真熱鬧,春花似錦蕴侧、人聲如沸择同。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽敲才。三九已至,卻和暖如春择葡,著一層夾襖步出監(jiān)牢的瞬間紧武,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評論 1 271
  • 我被黑心中介騙來泰國打工敏储, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留阻星,地道東北人。 一個月前我還...
    沈念sama閱讀 48,798評論 3 376
  • 正文 我出身青樓已添,卻偏偏與公主長得像妥箕,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子更舞,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,435評論 2 359

推薦閱讀更多精彩內(nèi)容