Alteryx問答--Alteryx是ETL工具嗎动猬?它與SSIS有什么不同唆鸡?
【提問】我的客戶希望我使用Alteryx實施ETL過程,因為他們有許可證枣察。我很困惑Alteryx是否是ETL工具。我相信Alteryx通常用于為Tableau數(shù)據(jù)可視化工具準備數(shù)據(jù)燃逻。
請指教是否使用ETL工具序目?它與SSIS有什么不同?
【答復】
1伯襟、是猿涨,Alteryx是ETL和數(shù)據(jù)扯皮的工具,但它確實比純ETL多了不少姆怪。 Alteryx與許多嵌入式功能(如數(shù)據(jù)挖掘叛赚,地理空間,數(shù)據(jù)清理)結(jié)合起來提供預先連接(Experian/Tableau等)選項稽揭,以在一個產(chǎn)品中提供一套工具俺附。
如果您正在尋找的是基本的a-> b ETL映射,并且您不需要Alteryx提供的附加功能溪掀,那么像SSIS這樣的更便宜的產(chǎn)品往往綽綽有余事镣。
2、Alteryx是一個數(shù)據(jù)準備/高級分析應(yīng)用程序揪胃。人們以許多不同的方式使用它璃哟,因為它允許數(shù)據(jù)準備,空間分析和預測喊递。
我與許多客戶合作随闪,他們選擇純粹將Alteryx用于其ETL功能,將數(shù)據(jù)從一個數(shù)據(jù)庫移動到另一個數(shù)據(jù)庫骚勘,例如我曾與一位使用Alteryx將客戶端的負載自動從MySQL遷移到Amazon Redshift數(shù)據(jù)庫的客戶端進行了合作铐伴,另一位客戶正在使用SQL - > Tableau數(shù)據(jù)引擎,以及其他許多涉及一系列數(shù)據(jù)輸入的示例(Alteryx支持所有自定義API - > Excel)调鲸。
如果你已經(jīng)在使用SSIS盛杰,那么你會發(fā)現(xiàn)Alteryx呼吸新鮮空氣,說實話藐石,我在過去的生活中一直在使用SSIS即供,后來發(fā)現(xiàn)Alteryx的開發(fā)速度要快得多。它更容易改變數(shù)據(jù)于微,并允許更緊密地集成許多不同的數(shù)據(jù)源逗嫡。新的數(shù)據(jù)庫內(nèi)置工具與以前可能實現(xiàn)的SQL緊密集成允許在數(shù)據(jù)庫內(nèi)完成工作青自。
最后,與SSIS相比驱证,我認為你會發(fā)現(xiàn)Alteryx非常簡單易學延窜。他們網(wǎng)站上的在線培訓視頻將為您提供盡可能多的介紹。
3抹锄、Alteryx可以逆瑞,只要你有一個Alteryx服務(wù)器用于ETL。我用它來處理一些用例伙单,尤其是在云數(shù)據(jù)庫之間获高。
有些事情,在我個人的意見吻育,使其明顯優(yōu)于SSIS:
如果輸入有列名(從數(shù)據(jù)庫或從頭部csv文件)念秧,它自動處理意想不到的新列或列的順序變化,而不需要你改變流量布疼。
您可以將流構(gòu)建為“宏”摊趾,然后您可以完全獨立于源/目標數(shù)據(jù)庫進行單元測試(嘗試在SSIS中進行測試..)
能夠在流程中的任何位置放置瀏覽工具并進行有效調(diào)試。
使用“測試”工具構(gòu)建斷言游两。
流是從服務(wù)器上的命令行運行的砾层,我發(fā)現(xiàn)(除了使用Alteryx自己的調(diào)度器)最簡單的方法是將其另存為“應(yīng)用程序”,然后從使用Alteryx引擎從命令行運行可執(zhí)行文件器罐,通過xml文件傳遞參數(shù)梢为。您可以通過點擊魔棒按鈕(在將流保存為.yxwz(app)之后)從流中保存示例xml參數(shù)文件。這會顯示一個面板轰坊,可讓您設(shè)置變量铸董,并且該面板具有方便的“保存“按鈕,它以正確的格式生成一個xml文件肴沫。
在流本身內(nèi)部粟害,可以通過操作工具或模塊級別參數(shù)(User。*)參數(shù)化環(huán)境設(shè)置等 - 然后可以使用%User在輸入上設(shè)置數(shù)據(jù)庫服務(wù)器[變量名稱]%在該領(lǐng)域颤芬。
錯誤日志通常非常出色(識別失敗的工具悲幅,有用的錯誤消息),命令行拋出有用的錯誤級別號碼站蝠,因此非常簡單汰具,可以安排一些第三方調(diào)度程序(或僅使用Alteryx服務(wù)器自己的調(diào)度程序)。
顯然菱魔,如果你需要做任何嚴肅的數(shù)據(jù)操作留荔,pivoting等,那么它就是我使用過的最簡單的工具澜倦。