何謂數(shù)據(jù)分析
數(shù)據(jù):也稱(chēng)觀(guān)測(cè)值鞍爱,是通過(guò)實(shí)驗(yàn)測(cè)量踏兜、觀(guān)察军拟、調(diào)查等方式獲取的結(jié)果幸乒,常常以數(shù)量的形式展現(xiàn)出來(lái)
問(wèn):通過(guò)這些數(shù)據(jù)我們可以得到什么?
答:我們可以將隱藏在一大批看似雜亂無(wú)章的數(shù)據(jù)背后的信息集中和提煉出來(lái),總結(jié)出研究對(duì)象的內(nèi)在規(guī)律——這個(gè)就是數(shù)據(jù)分析:數(shù)據(jù)分析能夠幫助管理者進(jìn)行判斷和決策漠秋,以便制定適當(dāng)策略與采取相應(yīng)的行動(dòng)笙蒙。
舉個(gè)??:企業(yè)的高層希望通過(guò)市場(chǎng)分析和研究,把握產(chǎn)品的市場(chǎng)發(fā)展和動(dòng)向從而制定合理的產(chǎn)品研發(fā)和銷(xiāo)售計(jì)劃
備注:我們常說(shuō)的數(shù)據(jù)分析是狹義的數(shù)據(jù)分析
狹義——數(shù)據(jù)分析
定義:根據(jù)分析目的庆锦,用適當(dāng)?shù)姆治龇椒肮ぞ咄蔽唬瑢?duì)數(shù)據(jù)進(jìn)行處理和分析,提取有價(jià)值的信息搂抒,形成有效結(jié)論的過(guò)程
作用:主要三大作用——現(xiàn)狀分析艇搀,原因分析,預(yù)測(cè)分析
方法:主要方法——對(duì)比分析求晶、分組分析焰雕、結(jié)構(gòu)分析、分布分析芳杏、交叉分析矩屁、矩陣分析、回歸分析等常見(jiàn)分析方法
結(jié)果:數(shù)據(jù)分析一般都是得到一個(gè)指標(biāo)統(tǒng)計(jì)量的結(jié)果爵赵,如總和吝秕,平均值、計(jì)數(shù)等空幻,這些指標(biāo)數(shù)據(jù)都需要與業(yè)務(wù)結(jié)合進(jìn)行解讀烁峭,才能發(fā)揮出數(shù)據(jù)的價(jià)值與作用
數(shù)據(jù)挖掘
定義:從大量數(shù)據(jù)中,通過(guò)統(tǒng)計(jì)學(xué)氛悬,機(jī)器學(xué)習(xí)则剃,數(shù)據(jù)可視化方法,挖掘出未知但有價(jià)值的信息和知識(shí)的過(guò)程
作用:側(cè)重解決四類(lèi)問(wèn)題——分類(lèi)如捅、聚類(lèi)棍现、關(guān)聯(lián)和預(yù)測(cè),數(shù)據(jù)挖掘的重點(diǎn)在于尋找未知的模式與規(guī)律(舉個(gè)??:??和尿布)
方法:主要采用決策樹(shù)镜遣、神經(jīng)網(wǎng)絡(luò)己肮、關(guān)聯(lián)規(guī)則、聚類(lèi)分析悲关、時(shí)間序列分析等統(tǒng)計(jì)學(xué)谎僻、及其學(xué)習(xí)等高級(jí)分析方法進(jìn)行挖掘
結(jié)果:輸出模型或規(guī)則,同時(shí)計(jì)算出模型得分或標(biāo)簽寓辱。模型得分如流失概率值艘绍,綜合得分,相似度秫筏,預(yù)測(cè)值等诱鞠,標(biāo)簽如流失與非流失挎挖,高中低價(jià)值用戶(hù)、信用的優(yōu)良中差等
數(shù)據(jù)分析的流程
1.1 明確分析目的:任何事情都要有一個(gè)目的航夺,目標(biāo)蕉朵,整體事情的執(zhí)行方向要確認(rèn)棺弊,否則在后期數(shù)據(jù)處理的過(guò)程中容易迷失自己众羡,覺(jué)的這個(gè)可以分析,那個(gè)也可以分析议双,結(jié)果到頭來(lái)什么都沒(méi)有分析出來(lái)缭保。記住這句話(huà):
一切都是以解決問(wèn)題為中?
1.2 明確分析思路:基于目的汛闸,開(kāi)始梳理分析思路,搭建分析框架艺骂,同時(shí)要確保分析框架的體系化蛉拙,使分析結(jié)果具有說(shuō)服力
體系化——有邏輯,邏輯可自洽彻亲,開(kāi)始的時(shí)候可能速度會(huì)慢一些,但堅(jiān)持梳理多問(wèn)自己”為什么“吮廉,邏輯性就會(huì)不斷提升苞尝。此外,分析框架要結(jié)合實(shí)際業(yè)務(wù)宦芦,針對(duì)各個(gè)業(yè)務(wù)有相關(guān)的專(zhuān)業(yè)模型宙址,這個(gè)模型在于日常積累,在你沒(méi)有其他更好的方法调卑,方法論很重要抡砂,比如
營(yíng)銷(xiāo)方面:4P,用戶(hù)行為恬涧,STP理論注益,SWOT等
管理方法:PEST,5W2H溯捆,時(shí)間管理丑搔,生命周期,邏輯樹(shù)提揍,金字塔啤月,SMART原則等
2 數(shù)據(jù)收集:
? ??????????數(shù)據(jù)源:數(shù)據(jù)庫(kù),公開(kāi)出版物劳跃,互聯(lián)網(wǎng)谎仲,市場(chǎng)調(diào)查
3 數(shù)據(jù)處理
? ??????????數(shù)據(jù)清洗——數(shù)據(jù)合并——數(shù)據(jù)抽取——數(shù)據(jù)計(jì)算——數(shù)據(jù)轉(zhuǎn)換等
4 數(shù)據(jù)分析
分析方法+分析工具(Excel SPSS R Python等)
5 數(shù)據(jù)展現(xiàn)
? ? 謹(jǐn)記:圖>表>文字,根據(jù)分析目的選擇合適的圖(下面的圖也是看簡(jiǎn)書(shū)過(guò)程中看到的刨仑,覺(jué)得很好郑诺,放在這里供大家學(xué)習(xí))
6 報(bào)告撰寫(xiě)
數(shù)據(jù)分析報(bào)告是對(duì)整個(gè)數(shù)據(jù)分析過(guò)程的一個(gè)總結(jié)與呈現(xiàn)夹姥,沒(méi)有結(jié)論的數(shù)據(jù)分析不是好的數(shù)據(jù)分析。
數(shù)據(jù)分析的三大誤區(qū)
默念 3遍:業(yè)務(wù)為王
1.分析目的不明確间景,為分析而分析
2.缺乏業(yè)務(wù)知識(shí)佃声,分析結(jié)果偏離實(shí)際
3.一味追求實(shí)用高級(jí)分析方法,熱衷于研究模型
數(shù)據(jù)分析師的要求
幾個(gè)常用指標(biāo)和術(shù)語(yǔ)
相對(duì)數(shù)=比較數(shù)值(比數(shù))
基礎(chǔ)數(shù)值(基數(shù))
百分點(diǎn):不同時(shí)期以百分?jǐn)?shù)的形式表示的相對(duì)指標(biāo)的變動(dòng)幅度
比例:總體中各部分的數(shù)值占全部數(shù)值的比重倘要,通常反應(yīng)總體的構(gòu)成和結(jié)構(gòu)
比率:不同類(lèi)別數(shù)值的對(duì)比圾亏,整體中各部分直接的關(guān)系
番數(shù):原來(lái)數(shù)量的2的N次方倍
同比:與歷史同期進(jìn)行比較得到的數(shù)值
環(huán)比:前一個(gè)統(tǒng)計(jì)周期進(jìn)行比較得到的數(shù)值