BI/ETL在數(shù)據(jù)分析中是什么角色?

本文要回答幾個問題铭拧,BI赃蛛、ETL、數(shù)據(jù)分析都是什么意思搀菩?怎么做數(shù)據(jù)分析呕臂?他們之間的關(guān)系是什么?

數(shù)據(jù)分析是什么肪跋?

簡言之歧蒋,數(shù)據(jù)分析是從大量數(shù)據(jù)中,用適當?shù)慕y(tǒng)計分析方法州既,提取出有用信息的過程谜洽。

數(shù)據(jù)分析在企業(yè)里通常稱為BI,即商業(yè)智能business intelligence吴叶,是指將企業(yè)業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)進行統(tǒng)計分析阐虚,形成有規(guī)律的信息,來輔助用戶做出決策蚌卤。

實現(xiàn)BI的過程就需要ETL实束,ETL的流程通常是:

1、獲取數(shù)據(jù)extract?

2造寝、轉(zhuǎn)換磕洪、清洗數(shù)據(jù)transform

3、加載調(diào)取數(shù)據(jù)load

4诫龙、圖表統(tǒng)計展現(xiàn)BI

數(shù)據(jù)分析怎么做析显?

大家都有過下飯館或者做菜的經(jīng)驗吧?要經(jīng)過客人點菜签赃,廚房做菜谷异,服務(wù)員上菜的過程分尸,做數(shù)據(jù)分析的過程也類似,可分為五個步驟:

1.明確需求——點菜

明確需求是核心歹嘹,要知道用戶的目的是什么箩绍,需求分析人員要全面了解、理解業(yè)務(wù)尺上,并得到關(guān)鍵用戶對業(yè)務(wù)邏輯的認可和確認材蛛,而不能自己猜測用戶的需求邏輯,避免徒勞無益怎抛,之后的所有步驟也都要以業(yè)務(wù)需求為核心來進行卑吭。

2.數(shù)據(jù)采集、清洗——洗菜

采集:加法马绝,盡可能收集數(shù)據(jù)豆赏,越全面越好,減少數(shù)據(jù)盲點富稻。

清洗:減法掷邦,清洗、修復(fù)無效數(shù)據(jù)(如:錯誤椭赋、重復(fù)抚岗、殘缺記錄,缺失值處理等)纹份,確保數(shù)據(jù)分析完整性苟跪、準確性。

3.數(shù)據(jù)處理——配菜

根據(jù)業(yè)務(wù)需求蔓涧,對數(shù)據(jù)進行整理(如按條件篩選提取件已,聚合、分類元暴、匯總等)篷扩,建立數(shù)據(jù)模型、數(shù)據(jù)集茉盏。

4.數(shù)據(jù)分析——做菜

描述性分析:數(shù)據(jù)的集中趨勢——眾數(shù)鉴未、中位數(shù)、平均數(shù)
? ? ? ? ? ? ? ? ? ? ? 數(shù)據(jù)的離散趨勢——最大最小值鸠姨、極差铜秆、四分位差、方差和標準差

幾個統(tǒng)計名詞

趨勢性分析:對同一指標讶迁、比率在不同時期的值连茧,進行比較,觀察增加變動情況,獲得趨勢啸驯。

——定比客扎、環(huán)比、同比

幾個比率概念

相關(guān)性分析:分析現(xiàn)象間是否存在依存關(guān)系罚斗,及依存的相關(guān)程度和相關(guān)方向徙鱼。——不相關(guān)针姿、線性相關(guān)袱吆、非線性相關(guān)、相關(guān)但非線性相關(guān)搓幌。

相關(guān)性分析舉例
相關(guān)系數(shù)圖

相關(guān)系數(shù):是描述線性相關(guān)程度的量杆故。

5.結(jié)果展現(xiàn)——上菜

將數(shù)據(jù)分析的結(jié)果,以報告溉愁、報表、圖表饲趋、監(jiān)控儀表盤等形式展現(xiàn)給用戶拐揭,為決策判斷提供支持依據(jù)。

由此可見奕塑,BI實施過程中堂污,甲方、乙方所扮演的角色分別是:

甲方用戶是客人龄砰,

乙方廠商是飯館盟猖,

信息圖表像菜肴,

需求分析像服務(wù)員换棚,

BI工程師像大廚式镐,

ETL工程師像后廚小工,

很形象吧固蚤?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末娘汞,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子夕玩,更是在濱河造成了極大的恐慌你弦,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件燎孟,死亡現(xiàn)場離奇詭異禽作,居然都是意外死亡,警方通過查閱死者的電腦和手機揩页,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進店門旷偿,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事狸捅≈则眩” “怎么了?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵尘喝,是天一觀的道長磁浇。 經(jīng)常有香客問我,道長朽褪,這世上最難降的妖魔是什么置吓? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮缔赠,結(jié)果婚禮上衍锚,老公的妹妹穿的比我還像新娘。我一直安慰自己嗤堰,他們只是感情好戴质,可當我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著踢匣,像睡著了一般告匠。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上离唬,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天后专,我揣著相機與錄音,去河邊找鬼输莺。 笑死戚哎,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的嫂用。 我是一名探鬼主播型凳,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼尸折!你這毒婦竟也來了啰脚?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤实夹,失蹤者是張志新(化名)和其女友劉穎橄浓,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體亮航,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡荸实,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了缴淋。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片准给。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡泄朴,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出露氮,到底是詐尸還是另有隱情祖灰,我是刑警寧澤,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布畔规,位于F島的核電站局扶,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏叁扫。R本人自食惡果不足惜三妈,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望莫绣。 院中可真熱鬧畴蒲,春花似錦、人聲如沸对室。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽软驰。三九已至涧窒,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間锭亏,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工硬鞍, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留慧瘤,地道東北人。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓固该,卻偏偏與公主長得像锅减,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子伐坏,可洞房花燭夜當晚...
    茶點故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容