隨著計(jì)算機(jī)和互聯(lián)網(wǎng)的發(fā)展,人們?cè)诟黜?xiàng)活動(dòng)中形成的數(shù)據(jù)容量呈幾何級(jí)數(shù)增長(zhǎng)属铁,對(duì)數(shù)據(jù)的分析和利用已經(jīng)滲透到生活的方方面面眠寿。大數(shù)據(jù)的時(shí)代對(duì)商業(yè)、對(duì)思維红选、對(duì)管理的變革澜公,無論是企業(yè)、政府以及個(gè)人都想要把大數(shù)據(jù)納入囊中成為一把利器。那么坟乾,今天迹辐,我們就來對(duì)數(shù)據(jù)分析進(jìn)行一個(gè)拆解,讓您對(duì)數(shù)據(jù)分析的學(xué)習(xí)有方向可循甚侣。
先拋個(gè)問題:你知道制作這樣一張數(shù)據(jù)報(bào)表明吩,都需要經(jīng)過哪些步驟嗎?
貼一張dashboard
我們可以將這張報(bào)表比喻成一道菜殷费,而它分別需要經(jīng)歷買菜印荔,洗菜,切菜详羡,烹飪仍律,上菜幾個(gè)過程。這幾個(gè)過程也分別對(duì)應(yīng)著我們的原數(shù)據(jù)提取实柠,數(shù)據(jù)處理(數(shù)據(jù)清洗水泉,轉(zhuǎn)換),數(shù)據(jù)分析方法窒盐,可視化報(bào)表草则。
買菜(原數(shù)據(jù)提取):
買什么菜:確定數(shù)據(jù)范圍
想要制作一張具備分析價(jià)值的可視化報(bào)表蟹漓,數(shù)據(jù)是必備的基礎(chǔ)要素炕横。每個(gè)企業(yè)都會(huì)有包含關(guān)于企業(yè)經(jīng)營范圍內(nèi)的業(yè)務(wù)數(shù)據(jù),但是成千上萬條數(shù)據(jù)不可能全部都利用上葡粒。在開始一項(xiàng)數(shù)據(jù)分析前份殿,要明白我們要分析的主題或者問題是什么?然后對(duì)這個(gè)問題進(jìn)行拆解塔鳍、量化伯铣,從而確定我們所需要的數(shù)據(jù)是哪些。
買什么類型的菜:
定義了買什么菜以后轮纫,我們就要確定菜的具體類型是什么腔寡,比如買辣椒,辣椒又分為小米椒掌唾,線椒放前,青椒夹抗,干辣椒等彼水。我們的數(shù)據(jù)也分為日期型的數(shù)據(jù),整數(shù)型的數(shù)據(jù)薄啥,布爾類型的數(shù)據(jù)以及字符串類型的數(shù)據(jù)等撩扒。不同的數(shù)據(jù)類型定義了不同的數(shù)據(jù)格式似扔,也會(huì)在數(shù)據(jù)的分析和可視化中體現(xiàn)出來吨些。比如日期型數(shù)據(jù)的格式一般是:2020-08-03或者2020/08/03等。
數(shù)據(jù)類型 數(shù)據(jù)樣例
日期型 2020-08-03或者2020/08/03
日期時(shí)間型 2008-12-26 16:23:55
整數(shù)型 45382炒辉,34893豪墅,809427
字符串型 ‘蘋果’,‘草莓’黔寇,‘哈密瓜’
布爾類型 是或否
小數(shù)型 32.33偶器,36.58,565.89
[圖片上傳失敗...(image-95eb3e-1599529301934)]
去哪里買菜:
我們買菜一般都在菜集中的地方缝裤,如菜市場(chǎng)屏轰、超市或者手機(jī)上買菜的APP等。我們的數(shù)據(jù)同樣有它集中存儲(chǔ)的地點(diǎn)憋飞,也就是數(shù)據(jù)庫霎苗,數(shù)據(jù)倉庫,數(shù)據(jù)湖榛做,數(shù)據(jù)集市等叨粘。
數(shù)據(jù)庫:
數(shù)據(jù)庫是“按照數(shù)據(jù)結(jié)構(gòu)來組織、存儲(chǔ)和管理數(shù)據(jù)的倉庫”瘤睹。是一個(gè)以一定方式長(zhǎng)期存儲(chǔ)在計(jì)算機(jī)內(nèi)的、有組織的答倡、可共享的轰传、統(tǒng)一管理的大量數(shù)據(jù)的集合,是一個(gè)能與多個(gè)用戶共享瘪撇、具有盡可能小的冗余度获茬、與應(yīng)用程序彼此獨(dú)立的數(shù)據(jù)集合,可視為電子化的文件柜——存儲(chǔ)電子文件的處所倔既,用戶可以對(duì)文件中的數(shù)據(jù)進(jìn)行新增恕曲、查詢、更新渤涌、刪除等操作佩谣。
主流關(guān)系數(shù)據(jù)庫
(1)商用數(shù)據(jù)庫:Oracle, SQL Server, DB2等;
(2)開源數(shù)據(jù)庫:MySQL, PostgreSQL等实蓬;
(3)桌面數(shù)據(jù)庫:以微軟Access為代表茸俭,適合桌面應(yīng)用程序使用
(4)嵌入式數(shù)據(jù)庫:以Sqlite為代表,適合手機(jī)應(yīng)用和桌面程序
洗菜安皱、切菜:運(yùn)用SQL語言或者Tableau Prep工具做數(shù)據(jù)處理
理解了數(shù)據(jù)和數(shù)據(jù)的存儲(chǔ)地點(diǎn)以后调鬓,我們?cè)撊绾翁崛〕鑫覀兊臄?shù)據(jù)?
這里就要介紹我們的結(jié)構(gòu)化查詢語言(Structured Query Language)簡(jiǎn)稱SQL酌伊,它是一種特殊目的的編程語言腾窝,是一種數(shù)據(jù)庫查詢和程序設(shè)計(jì)語言,用于存取數(shù)據(jù)以及查詢、更新和管理關(guān)系數(shù)據(jù)庫系統(tǒng)虹脯。
初次接觸SQL還是在大學(xué)的《數(shù)據(jù)庫應(yīng)用》這門課中驴娃,我們學(xué)習(xí)了Access數(shù)據(jù)庫的簡(jiǎn)單SQL語句,思維的啟蒙為我在后來的SQL學(xué)習(xí)中奠定了一大步基礎(chǔ)归形。簡(jiǎn)單說SQL就是通過編寫一些語句托慨,去查詢數(shù)據(jù)或者獲取你想要的數(shù)據(jù),這種方式減少了數(shù)據(jù)的冗余暇榴,想要什么數(shù)據(jù)提取什么數(shù)據(jù)即可厚棵。為BI開發(fā)工具省去內(nèi)存,一定程度上提高性能蔼紧。
另外婆硬,通過SQL我們可以為我們的數(shù)據(jù)進(jìn)行處理,比如將數(shù)據(jù)轉(zhuǎn)換類型奸例,進(jìn)行簡(jiǎn)單計(jì)算等彬犯。想要更深入學(xué)習(xí)SQL,推薦書籍《SQL必知必會(huì)》查吊,推薦網(wǎng)站SQL教程
數(shù)據(jù)提刃城:
Select 列名稱 from 表名稱
如提取訂單表中的產(chǎn)品名稱, 銷售額信息:
SELECT product_name, sales FROM order
數(shù)據(jù)轉(zhuǎn)換:
將日期時(shí)間類型的數(shù)據(jù)轉(zhuǎn)換為日期格式:
CAST(表達(dá)式 AS 數(shù)據(jù)類型)
SELECT CAST( now() AS DATE ) FROM order
Now()=2020-08-31 18:43:00
數(shù)據(jù)清洗:
只提取訂單狀態(tài)為已結(jié)算的數(shù)據(jù):
SELECT * FROM order
WHERE order_status='已結(jié)算'
數(shù)據(jù)計(jì)算:
提取各個(gè)產(chǎn)品的平均銷售額數(shù)據(jù):
SELECT AVG(sales) FROM order
當(dāng)然了,SQL只是一種對(duì)于結(jié)構(gòu)化數(shù)據(jù)進(jìn)行數(shù)據(jù)提取逻卖,轉(zhuǎn)換宋列,清洗的語言。企業(yè)中的數(shù)據(jù)往往也會(huì)更復(fù)雜一些评也,需要更加專業(yè)的數(shù)據(jù)清洗工具進(jìn)行清洗炼杖,轉(zhuǎn)換等。
Tableau prep:數(shù)據(jù)處理工具
Tableau Prep是tableau系列的產(chǎn)品之一盗迟,主要用于對(duì)數(shù)據(jù)的處理坤邪,它不需要寫SQL語句,只需通過一些拖拉拽即可滿足對(duì)于數(shù)據(jù)的處理需求罚缕,如篩選艇纺、拆分、重命名邮弹、轉(zhuǎn)置喂饥、聯(lián)接和合并等操作。非常適合業(yè)務(wù)人員處理數(shù)據(jù)時(shí)使用肠鲫,無需代碼操作即可把數(shù)據(jù)處理成自己想要的樣子员帮。
烹飪:
當(dāng)我們準(zhǔn)備好了我們的原材料(原數(shù)據(jù)),接下來就要想如何做這道菜了导饲。做這道菜的方法也就是我們要分析數(shù)據(jù)的方法捞高。通常我們會(huì)借助一些分析模型氯材,來得到更加專業(yè)、清晰的報(bào)表硝岗。這里簡(jiǎn)單介紹幾種模型:
CRM中常用的RFM模型氢哮,對(duì)客戶進(jìn)行細(xì)分
R(Recency):客戶最近一次交易時(shí)間的間隔。R值越大型檀,表示客戶交易發(fā)生的日期越久冗尤,反之則表示客戶交易發(fā)生的日期越近。
F(Frequency):客戶在最近一段時(shí)間內(nèi)交易的次數(shù)胀溺。F值越大裂七,表示客戶交易越頻繁,反之則表示客戶交易不夠活躍仓坞。
M(Monetary):客戶在最近一段時(shí)間內(nèi)交易的金額背零。M值越大,表示客戶價(jià)值越高无埃,反之則表示客戶價(jià)值越低徙瓶。
產(chǎn)品分析中的波士頓矩陣:
波士頓矩陣(BCG Matrix),又稱市場(chǎng)增長(zhǎng)率-相對(duì)市場(chǎng)份額矩陣嫉称,由美國著名的管理學(xué)家侦镇、波士頓咨詢公司創(chuàng)始人布魯斯·亨德森于1970年首創(chuàng),它是通過銷售增長(zhǎng)率(反應(yīng)市場(chǎng)引力的指標(biāo))和市場(chǎng)占有率(反應(yīng)企業(yè)實(shí)力的指標(biāo))來分析決定企業(yè)的產(chǎn)品結(jié)構(gòu)织阅。
BCG矩陣由縱軸的銷售增長(zhǎng)率和橫軸的相對(duì)市場(chǎng)占有率組成虽缕,橫縱軸分別有高和低兩種狀態(tài)描述某個(gè)產(chǎn)品更接近于哪個(gè)位置,就這樣形成了4種組合蒲稳、4個(gè)象限、4類產(chǎn)品伍派。
明星類產(chǎn)品:高增長(zhǎng)且高市占江耀,發(fā)展前景好,競(jìng)爭(zhēng)力強(qiáng)诉植,需加大投資以支持其發(fā)展祥国;
問題類產(chǎn)品:高增長(zhǎng)但低市占,發(fā)展前景好但市場(chǎng)開拓不足晾腔,需謹(jǐn)慎投資舌稀;
現(xiàn)金牛產(chǎn)品:低增長(zhǎng)但高市占,成熟市場(chǎng)的領(lǐng)導(dǎo)者灼擂,應(yīng)降低投資壁查,維持市占并延緩衰退;
瘦狗類產(chǎn)品:低增長(zhǎng)且低市占剔应,理論率低甚至虧損睡腿,應(yīng)采取撤退戰(zhàn)略语御。
更多關(guān)于波士頓矩陣的知識(shí)可以在一下鏈接中看到:https://www.zybuluo.com/notmylove/note/1518501
零售分析中的關(guān)聯(lián)購物籃分析:
相信不少同學(xué)都聽過啤酒和尿布的故事:在美國,婦女們經(jīng)常會(huì)囑咐她們的丈夫下班以后給孩子買一點(diǎn)尿布回來席怪,而丈夫在買完尿布后应闯,大都會(huì)順手買回一瓶自己愛喝的啤酒(由此看出美國人愛喝酒)。商家通過對(duì)一年多的原始交易記錄進(jìn)行詳細(xì)的分析挂捻,發(fā)現(xiàn)了這對(duì)神奇的組合碉纺。于是就毫不猶豫地將尿布與啤酒擺放在一起售賣,通過它們的關(guān)聯(lián)性刻撒,互相促進(jìn)銷售骨田。這就是產(chǎn)品的關(guān)聯(lián)性購買分析的經(jīng)典案例。購物籃分析是通過發(fā)現(xiàn)顧客在一次購買行為中放入購物籃中不同商品之間的關(guān)聯(lián)疫赎,研究顧客的購買行為盛撑,從而輔助零售企業(yè)制定營銷策略的一種數(shù)據(jù)分析方法。
通過歷史的交易訂單數(shù)據(jù)捧搞,我們可以分析在一個(gè)訂單中抵卫,購買產(chǎn)品A后又購買了產(chǎn)品BCDEF的頻次,從而發(fā)現(xiàn)產(chǎn)品之間的關(guān)聯(lián)性購買強(qiáng)度胎撇。企業(yè)往往可以通過發(fā)現(xiàn)產(chǎn)品之間的關(guān)聯(lián)而進(jìn)行產(chǎn)品組合的一系列營銷活動(dòng)介粘,以提升公司銷售額。
除了分析模型晚树,往往可能我們只是需要看一看時(shí)間趨勢(shì)或某指標(biāo)的分類占比等姻采,這就要確定我們的需求,多問一問自己:通過數(shù)據(jù)的分析想看到什么爵憎?不同的視角我們需要運(yùn)用不同的可視化圖表來更直觀的體現(xiàn)慨亲。如想要看某產(chǎn)品的銷售額時(shí)間趨勢(shì),這時(shí)就要想到使用折線圖來體現(xiàn)宝鼓,若想要看占比情況則可以使用餅圖刑棵,環(huán)形圖等。
具體的可視化圖表可以參考下圖:
(圖片)
常用指標(biāo)含義
ROI(Return On Investment )投資回報(bào)率
反映投入和產(chǎn)出的關(guān)系愚铡,衡量我這個(gè)投資值不值得蛉签,能給到我多少價(jià)值的東西(非單單的利潤(rùn)),這個(gè)是站在投資的角度或長(zhǎng)遠(yuǎn)生意上看的沥寥。通常用于評(píng)估企業(yè)對(duì)于某項(xiàng)活動(dòng)的價(jià)值碍舍,ROI高表示該項(xiàng)目?jī)r(jià)值高。
投資回報(bào)率(ROI)= 年利潤(rùn)或年均利潤(rùn)/投資總額×100%邑雅。
重復(fù)購買率:指消費(fèi)者在網(wǎng)站中的重復(fù)購買次數(shù)片橡。
同比:指的是與歷史同時(shí)期的數(shù)據(jù)相比較而獲得的比值,反應(yīng)事物發(fā)展的相對(duì)性淮野。
環(huán)比:指與上一個(gè)統(tǒng)計(jì)時(shí)期的值進(jìn)行對(duì)比獲得的值锻全,主要反映事物的逐期發(fā)展的情況狂塘。
用戶數(shù)據(jù)指標(biāo):
行為數(shù)據(jù)指標(biāo):
產(chǎn)品數(shù)據(jù)指標(biāo):
上菜:數(shù)據(jù)報(bào)告的呈現(xiàn)
當(dāng)菜做好了以后,我們就要把菜端到餐桌上供大家品嘗了鳄厌。而我們的報(bào)表制作完成后荞胡,一種形式是放在服務(wù)器供大家參考分析,另外一種形式就是制作成數(shù)據(jù)分析報(bào)告向老板做匯報(bào)了嚎。做匯報(bào)的數(shù)據(jù)分析就要根據(jù)不同的場(chǎng)景不同的人員進(jìn)行報(bào)表的講解泪漂,往往注重報(bào)告給相關(guān)人員他們更加關(guān)注的數(shù)據(jù)。
給老板做匯報(bào):更加關(guān)注趨勢(shì)歪泳、預(yù)測(cè)萝勤、宏觀KPI、重要警戒指標(biāo)呐伞;
給部門負(fù)責(zé)人做匯報(bào):關(guān)心達(dá)成敌卓、進(jìn)度、異常點(diǎn)分布伶氢、排名
給運(yùn)營或者營銷負(fù)責(zé)人做匯報(bào):關(guān)注異常點(diǎn)趟径、探索差異、尋找標(biāo)桿
給基層員工做匯報(bào):關(guān)注完成度癣防、績(jī)效獎(jiǎng)勵(lì)蜗巧、員工排名、站點(diǎn)排名
我們簡(jiǎn)單做一個(gè)小結(jié):制作數(shù)據(jù)分析報(bào)表蕾盯,就好像制作一道菜幕屹。首先需要有做菜的原材料,報(bào)表的原材料則是數(shù)據(jù)级遭,只有對(duì)我們的數(shù)據(jù)有清晰的認(rèn)識(shí)望拖,才能獲取我們想要的原材料。之后要明確去哪里獲取原材料挫鸽,我們介紹了數(shù)據(jù)的存儲(chǔ)地说敏,數(shù)據(jù)庫、數(shù)據(jù)倉庫掠兄、數(shù)據(jù)集市的概念,接著我們學(xué)習(xí)做菜的方法锌雀,介紹了數(shù)據(jù)分析中常用的模型:CRM客戶分析的RFM模型蚂夕,產(chǎn)品分析中的波士頓矩陣,訂單分析中的購物籃關(guān)聯(lián)性分析腋逆。另外介紹了制作報(bào)表時(shí)的可視化圖形選擇婿牍。最后,我們圍繞如何對(duì)制作好的數(shù)據(jù)報(bào)表進(jìn)行數(shù)據(jù)報(bào)告做了一個(gè)分析惩歉。
綜上所述等脂,想要掌握好數(shù)據(jù)分析的技能俏蛮,我們要掌握一定的數(shù)據(jù)處理能力,如SQL使用能力以及對(duì)數(shù)據(jù)的認(rèn)識(shí)上遥。其次我們要有一定的分析思維搏屑,對(duì)于業(yè)務(wù)的理解能力,最后則是數(shù)據(jù)分析的工具使用能力粉楚。所以辣恋,懂可視化報(bào)表工具的應(yīng)用是遠(yuǎn)遠(yuǎn)不夠的,更加核心的是我們對(duì)業(yè)務(wù)的理解模软,以及對(duì)數(shù)據(jù)的理解伟骨。只有將大量的數(shù)據(jù)通過業(yè)務(wù)的分析理解并利用可視化工具展現(xiàn)出來,將冷冰冰的數(shù)據(jù)轉(zhuǎn)換成信息燃异,利用信息去挖掘知識(shí)形成企業(yè)洞察携狭,從而增進(jìn)智慧,才能為企業(yè)提高決策效率回俐,創(chuàng)造價(jià)值逛腿。
這一篇文章更多的介紹了在數(shù)據(jù)分析中的一些概念,接下來的一篇文章鲫剿,我會(huì)為大家以案例的形式詳細(xì)介紹業(yè)務(wù)中數(shù)據(jù)分析的具體流程和步驟鳄逾。