數(shù)據(jù)分析是指用適當(dāng)?shù)慕y(tǒng)計分析方法對收集來的大量數(shù)據(jù)進(jìn)行分析热鞍,將它們加以匯總和理解并消化,以求最大化地開發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)分析是為了提取有用信息和形成結(jié)論而對數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過程歉铝。這里的數(shù)據(jù)也稱觀測值,是通過實驗凑耻、測量太示、觀察、調(diào)查等方式獲取的結(jié)果香浩,常常以數(shù)量的形式展現(xiàn)出來类缤。
數(shù)據(jù)分析的目的是把隱藏在一大批看似雜亂無章的數(shù)據(jù)背后的信息集中和提煉出來,總結(jié)出所研究對象的內(nèi)在規(guī)律弃衍。在實際工作中呀非,數(shù)據(jù)分析能夠幫助管理者進(jìn)行判斷和決策,以便采取適當(dāng)策略與行動镜盯。
在統(tǒng)計學(xué)領(lǐng)域岸裙,有些學(xué)者將數(shù)據(jù)分析劃分為描述性數(shù)據(jù)分析、探索性數(shù)據(jù)分析以及驗證性數(shù)據(jù)分析速缆。
描述性數(shù)據(jù)分析屬于初級數(shù)據(jù)分析降允,常見的分析方法有對比分析法、平均分析法艺糜、交叉分析法等剧董。而探索性數(shù)據(jù)分析以及驗證性數(shù)據(jù)分析屬于高級數(shù)據(jù)分析,常見的分析方法有相關(guān)分析破停、因子分析翅楼、回歸分析等。
現(xiàn)狀分析真慢,原因分析毅臊,預(yù)測分析
數(shù)據(jù)分析過程主要包括6個既相對獨立又互有聯(lián)系的階段。它們是:明確分析目的和思路黑界、數(shù)據(jù)收集管嬉、數(shù)據(jù)處理、數(shù)據(jù)分析朗鸠、數(shù)據(jù)展現(xiàn)蚯撩、報告撰寫等6步
體系化也就是邏輯化,簡單來說就是先分析什么烛占,后分析什么胎挎,使得各個分析點之間具有邏輯聯(lián)系。
營銷方面的理論模型有4P忆家、用戶使用行為呀癣、STP理論、SWOT等弦赖,而管理方面的理論模型有PEST项栏、5W2H、時間管理蹬竖、生命周期沼沈、邏輯樹、金字塔币厕、SMART原則等列另。這些都是經(jīng)典的營銷、管理方面的理論旦装,需要在工作中不斷實踐應(yīng)用页衙,你才能體會其強(qiáng)大的作用。
數(shù)據(jù)來源:公司數(shù)據(jù)庫,公開發(fā)行物和發(fā)行報告店乐,互聯(lián)網(wǎng)(政府網(wǎng)站等)艰躺,市場調(diào)查。
數(shù)據(jù)處理的基本目的是從大量的眨八、雜亂無章腺兴、難以理解的數(shù)據(jù)中,抽取并推導(dǎo)出對解決問題有價值、有意義的數(shù)據(jù)廉侧。
數(shù)據(jù)處理主要包括數(shù)據(jù)清洗页响、數(shù)據(jù)轉(zhuǎn)化、數(shù)據(jù)提取段誊、數(shù)據(jù)計算等處理方法(參見圖1-7)闰蚕。一般拿到手的數(shù)據(jù)都需要進(jìn)行一定的處理才能用于后續(xù)的數(shù)據(jù)分析工作,即使再“干凈”的原始數(shù)據(jù)也需要先進(jìn)行一定的處理才能使用连舍。
數(shù)據(jù)挖掘側(cè)重解決四類數(shù)據(jù)分析問題:分類没陡、聚類、關(guān)聯(lián)和預(yù)測烟瞧,重點在尋找模式與規(guī)律诗鸭。
數(shù)據(jù)是通過表格和圖形的方式來呈現(xiàn)的,我們常說用圖表說話就是這個意思参滴。常用的數(shù)據(jù)圖表包括餅圖强岸、柱形圖、條形圖砾赔、折線圖蝌箍、散點圖、雷達(dá)圖等暴心,當(dāng)然可以對這些圖表進(jìn)一步整理加工妓盲,使之變?yōu)槲覀兯枰膱D形,例如金字塔圖专普、矩陣圖悯衬、漏斗圖、帕雷托圖等檀夹。
大多數(shù)情況下筋粗,人們更愿意接受圖形這種數(shù)據(jù)展現(xiàn)方式,因為它能更加有效炸渡、直觀地傳遞出分析師所要表達(dá)的觀點娜亿。記住,在一般情況下蚌堵,能用圖說明問題的就不用表格买决,能用表格說明問題的就不用文字沛婴。
數(shù)據(jù)分析報告其實是對整個數(shù)據(jù)分析過程的一個總結(jié)與呈現(xiàn)。通過報告督赤,把數(shù)據(jù)分析的起因嘁灯、過程、結(jié)果及建議完整地呈現(xiàn)出來够挂,供決策者參考旁仿。所以藕夫,數(shù)據(jù)分析報告是通過對數(shù)據(jù)全方位的科學(xué)分析來評估企業(yè)運營質(zhì)量孽糖,為決策者提供科學(xué)、嚴(yán)謹(jǐn)?shù)臎Q策依據(jù)毅贮,以降低企業(yè)運營風(fēng)險办悟,提高企業(yè)核心競爭力。
數(shù)據(jù)分析不應(yīng)為了分析而分析滩褥,而是應(yīng)該圍繞你的分析目的(了解現(xiàn)狀病蛉、找出業(yè)務(wù)變動原因、預(yù)測發(fā)展等)而進(jìn)行分析瑰煎。
只有對自己的目的有清晰的認(rèn)識铺然,你才知道要怎樣去實現(xiàn)這個目的,需要通過哪些圖表展現(xiàn)酒甸,才會知道這些圖表是否能反映問題魄健,自然而然地進(jìn)行相應(yīng)的問題分析,而不是連該說些什么都不知道插勤。
僅有分析模型遠(yuǎn)遠(yuǎn)不夠沽瘦,圍繞業(yè)務(wù)發(fā)現(xiàn)問題并解決問題才是數(shù)據(jù)分析的最終目的!不論高級的分析方法還是簡單的分析方法农尖,只要能夠解決業(yè)務(wù)問題析恋,就是好方法,正如我們常說的“不論黑貓還是白貓盛卡,只要能抓老鼠就是好貓”助隧。
將數(shù)據(jù)轉(zhuǎn)化為知識、結(jié)論和規(guī)律滑沧,就是數(shù)據(jù)分析的作用和價值并村。
對數(shù)據(jù)分析師的要求就不僅僅是單純做分析了,更重要的是與相關(guān)業(yè)務(wù)部門進(jìn)行合作嚎货,將數(shù)據(jù)真正應(yīng)用到業(yè)務(wù)中橘霎,根據(jù)實際的業(yè)務(wù)發(fā)展情況識別哪些數(shù)據(jù)可用,哪些不適用殖属,而不是孤立地在“真空環(huán)境”下進(jìn)行分析姐叁。這就要求數(shù)據(jù)分析師不僅具備洞察數(shù)據(jù)的能力,還要對相關(guān)業(yè)務(wù)的背景有深入的了解,明白客戶或業(yè)務(wù)部門的需求外潜,從而將數(shù)據(jù)信息化原环、可視化,最后轉(zhuǎn)化為生產(chǎn)力处窥,幫助企業(yè)獲得利潤嘱吗,這就是整個數(shù)據(jù)“供應(yīng)鏈”。當(dāng)然滔驾,數(shù)據(jù)分析師也需要理解這個“供應(yīng)鏈”谒麦。
懂業(yè)務(wù)、懂管理哆致、懂分析绕德、懂工具,還要懂設(shè)計摊阀。懂業(yè)務(wù)也是數(shù)據(jù)敏感的體現(xiàn)耻蛇。不懂業(yè)務(wù)的數(shù)據(jù)分析師,看到的只是一個個數(shù)字胞此;懂業(yè)務(wù)的數(shù)據(jù)分析師臣咖,則看到的不僅僅是數(shù)字,他明白數(shù)字代表什么意義漱牵,知道數(shù)字是大了還是小了夺蛇,心中有數(shù),這才是真正意義的數(shù)據(jù)敏感性布疙。
基本的分析方法有:對比分析法蚊惯、分組分析法、交叉分析法灵临、結(jié)構(gòu)分析法截型、漏斗圖分析法、綜合評價分析法儒溉、因素分析法宦焦、矩陣關(guān)聯(lián)分析法等。
高級的分析方法有:相關(guān)分析法顿涣、回歸分析法波闹、聚類分析法、判別分析法涛碑、主成分分析法精堕、因子分析法、對應(yīng)分析法蒲障、時間序列等歹篓。
基本的分析方法有:對比分析法瘫证、分組分析法、交叉分析法庄撮、結(jié)構(gòu)分析法背捌、漏斗圖分析法、綜合評價分析法洞斯、因素分析法毡庆、矩陣關(guān)聯(lián)分析法等。
高級的分析方法有:相關(guān)分析法烙如、回歸分析法么抗、聚類分析法、判別分析法厅翔、主成分分析法乖坠、因子分析法搀突、對應(yīng)分析法刀闷、時間序列等。
絕對數(shù)是反映客觀現(xiàn)象總體在一定時間仰迁、地點條件下的總規(guī)模甸昏、總水平的綜合性指標(biāo),也是數(shù)據(jù)分析中常用的指標(biāo)徐许,如GDP施蜜、總?cè)丝诘取4送獯朴纾^對數(shù)也可以表現(xiàn)為在一定時間翻默、地點條件下數(shù)量增減變化的絕對數(shù),比如A國人口比B國人口多1000萬人恰起。
相對數(shù)是指由兩個有聯(lián)系的指標(biāo)修械,對比計算而得到的數(shù)值,用以反映客觀現(xiàn)象之間數(shù)量聯(lián)系程度的綜合指標(biāo)检盼。計算相對數(shù)的基本公式是:
相對數(shù)=比較數(shù)值(比數(shù))/基礎(chǔ)數(shù)值(基數(shù))
分母是用做對比標(biāo)準(zhǔn)的指標(biāo)數(shù)值肯污,簡稱基數(shù);分子是用做與基數(shù)對比的指標(biāo)數(shù)值吨枉,簡稱比數(shù)蹦渣。相對數(shù)一般以倍數(shù)、成數(shù)貌亭、百分?jǐn)?shù)等表示柬唯,它反映了客觀現(xiàn)象之間數(shù)量聯(lián)系的程度。
頻數(shù)是指一組數(shù)據(jù)中個別數(shù)據(jù)重復(fù)出現(xiàn)的次數(shù)圃庭。如圖1-13的左圖所示锄奢,某校A班共50名學(xué)生美尸,按性別進(jìn)行分組,分為男與女兩個組別斟薇,男同學(xué)的頻數(shù)為30师坎,女同學(xué)的頻數(shù)為20。
頻率是每組類別次數(shù)與總次數(shù)的比值堪滨,它代表某類別在總體中出現(xiàn)的頻繁程度胯陋,一般采用百分?jǐn)?shù)表示,所有組的頻率加總等于100%袱箱。還是用某校A班的例子遏乔,30個男同學(xué)在50個同學(xué)中出現(xiàn)的頻率為60%,即(30÷50)×100%发笔;而20個女同學(xué)在50個同學(xué)中出現(xiàn)的頻率為40%盟萨,即(20÷50)×100%。
番數(shù)是指原來數(shù)量的2的N次方倍了讨。比如翻一番為原來數(shù)量的2倍(21)捻激,翻兩番為4倍(22)。如圖1-15所示前计,這位公司發(fā)言人在講話中就混淆了倍數(shù)與番數(shù)的概念胞谭。正確的說法應(yīng)該是“公司產(chǎn)品銷量翻一番(6.4 = 3.2×21),從去年的3.2萬件提高到今年的6.4萬件男杈。此外丈屹,我們成本控制也很好,由20萬元下降了50%伶棒,今年成本為10萬元”旺垒。
同比是指與歷史同時期進(jìn)行比較得到的數(shù)值,該指標(biāo)主要反映的是事物發(fā)展的相對情況肤无。例如2010年12月與2009年12月相比先蒋,如圖1-16的左圖所示。
環(huán)比是指與前一個統(tǒng)計期進(jìn)行比較得到的數(shù)值舅锄,該指標(biāo)主要反映的是事物逐期發(fā)展的情況鞭达。例如2010年12月與2010年11月相比
數(shù)據(jù)分析的六步曲:首先是明確分析目的和思路,然后是數(shù)據(jù)收集皇忿,第三步是將收集回來的數(shù)據(jù)進(jìn)行處理畴蹭,第四步是根據(jù)分析目的和思路進(jìn)行數(shù)據(jù)分析,第五步是將分析出的結(jié)果通過圖表的方式展現(xiàn)出來鳍烁,最后一步是撰寫數(shù)據(jù)分析報告叨襟。
數(shù)據(jù)分析三字經(jīng)。
① 學(xué)習(xí):先了解幔荒,后深入糊闽;先記錄梳玫,后記憶;先理論右犹,后實踐提澎;先模仿,后創(chuàng)新念链;
② 方法:先思路盼忌,后方法;先框架掂墓,后細(xì)化谦纱;先方法,后工具君编;先思考跨嘉,后動手;
③ 分析:先業(yè)務(wù)吃嘿,后數(shù)據(jù)祠乃;先假設(shè),后驗證唠椭;先總體跳纳,后局部;先總結(jié)贪嫂,后建議。
構(gòu)成政治環(huán)境的關(guān)鍵指標(biāo)有:政治體制艾蓝、經(jīng)濟(jì)體制力崇、財政政策、稅收政策赢织、產(chǎn)業(yè)政策亮靴、投資政策、專利數(shù)量于置、國防開支水平茧吊、政府補(bǔ)貼水平、民眾對政治的參與度等八毯。
構(gòu)成經(jīng)濟(jì)環(huán)境的關(guān)鍵指標(biāo)有:GDP及增長率搓侄、進(jìn)出口總額及增長率、利率话速、匯率讶踪、通貨膨脹率、消費價格指數(shù)泊交、居民可支配收入乳讥、失業(yè)率柱查、勞動生產(chǎn)率等。
構(gòu)成社會文化環(huán)境的關(guān)鍵指標(biāo)有:人口規(guī)模云石、性別比例唉工、年齡結(jié)構(gòu)、出生率汹忠、死亡率酵紫、種族結(jié)構(gòu)、婦女生育率错维、生活方式奖地、購買習(xí)慣、教育狀況赋焕、城市特點参歹、宗教信仰狀況等因素。
構(gòu)成技術(shù)環(huán)境的關(guān)鍵指標(biāo)有:新技術(shù)的發(fā)明和進(jìn)展隆判、折舊和報廢速度犬庇、技術(shù)更新速度、技術(shù)傳播速度侨嘀、技術(shù)商品化速度臭挽、國家重點支持項目、國家投入的研發(fā)費用咬腕、專利個數(shù)欢峰、專利保護(hù)情況等因素。
何因(Why)涨共、何事(What)纽帖、何人(Who)、何時(When)举反、何地(Where)懊直、如何做(How)、何價(How much)火鼻,這就構(gòu)成了5W2H分析法的總框架室囊。
例如我們需要了解公司產(chǎn)品的用戶購買行為是怎樣的。這時可在5W2H分析法的指導(dǎo)下整理分析用戶購買行為的思路魁索,建立用戶購買行為分析框架融撞。如圖2-5所示,根據(jù)5W2H分析法列出了對用戶購買行為的分析所需要了解的一些情況蛾默,比如用戶購買的目的是什么懦铺,公司產(chǎn)品在什么方面吸引了用戶等問題。
確定了分析框架后支鸡,我們再根據(jù)分析框架中的這些問題形成可量化的指標(biāo)進(jìn)行衡量和評價冬念,例如月均購買次數(shù)趁窃、人均購買量、再次購買平均間隔時長急前。
邏輯樹是分析問題最常使用的工具之一醒陆,它是將問題的所有子問題分層羅列,從最高層開始裆针,并逐步向下擴(kuò)展刨摩。
把一個已知問題當(dāng)成樹干,然后開始考慮這個問題和哪些相關(guān)問題有關(guān)世吨。每想到一點澡刹,就給這個問題所在的樹干加一個“樹枝”,并標(biāo)明這個“樹枝”代表什么問題耘婚,邏輯樹的使用必須遵循以下三個原則罢浇。
★要素化:把相同問題總結(jié)歸納成要素。
★框架化:將各個要素組織成框架沐祷,遵守不重不漏的原則嚷闭。
★關(guān)聯(lián)化:框架內(nèi)的各要素保持必要的相互關(guān)系,簡單而不孤立赖临。
產(chǎn)品(Product)胞锰、價格(Price)、渠道(Place)兢榨、促銷(Promotion)嗅榕,即著名的4P營銷理論,如圖2-8所示色乾。
★產(chǎn)品(Product):從市場營銷的角度來看誊册,產(chǎn)品是指能夠提供給市場,被人們使用和消費并滿足人們某種需要的任何東西暖璧,包括有形產(chǎn)品、服務(wù)君旦、人員澎办、組織、觀念或它們的組合金砍。
★價格(Price):是指顧客購買產(chǎn)品時的價格局蚀,包括基本價格、折扣價格恕稠、支付期限等琅绅。價格或價格決策關(guān)系到企業(yè)的利潤、成本補(bǔ)償鹅巍,以及是否有利于產(chǎn)品銷售千扶、促銷等問題料祠。影響定價的主要因素有三個:需求、成本與競爭澎羞。最高價格取決于市場需求髓绽,最低價格取決于該產(chǎn)品的成本費用,在最高價格和最低價格的幅度內(nèi)妆绞,企業(yè)能把這種產(chǎn)品價格定多高則取決于競爭者的同種產(chǎn)品的價格顺呕。
★渠道(Place):是指產(chǎn)品從生產(chǎn)企業(yè)流轉(zhuǎn)到用戶手上的全過程中所經(jīng)歷的各個環(huán)節(jié)。
★促銷(Promotion):是指企業(yè)通過銷售行為的改變來刺激用戶消費括饶,以短期的行為(比如讓利株茶,買一送一,營銷現(xiàn)場氣氛等等)促成消費的增長图焰,吸引其他品牌的用戶或?qū)е绿崆跋M來促進(jìn)銷售的增長启盛。廣告、宣傳推廣楞泼、人員推銷驰徊、銷售促進(jìn)是一個機(jī)構(gòu)促銷組合的四大要素。
網(wǎng)站分析的發(fā)展已經(jīng)較為成熟堕阔,有一套成熟的分析指標(biāo)棍厂。比如IP、PV超陆、頁面停留時間牺弹、跳出率、回訪者时呀、新訪問者张漂、回訪次數(shù)、回訪相隔天數(shù)谨娜、流失率航攒、關(guān)鍵字搜索、轉(zhuǎn)化率趴梢、登錄率漠畜,等等。遇到這么多指標(biāo)坞靶,所有的指標(biāo)都要采用嗎憔狞?什么指標(biāo)該采用?什么指標(biāo)又不該采用彰阴?各指標(biāo)之間有何聯(lián)系瘾敢?哪個指標(biāo)先分析?哪個指標(biāo)后分析?
所以我們需要梳理它們之間的邏輯關(guān)系簇抵,比如利用用戶使用行為理論進(jìn)行梳理庆杜。小白,這就是我們要學(xué)習(xí)的另外一個理論,即用戶使用行為理論,也是非常實用的數(shù)據(jù)分析指導(dǎo)理論之一赞别。
用戶使用行為是指用戶為獲取、使用物品或服務(wù)所采取的各種行動拓劝,用戶對產(chǎn)品首先需要有一個認(rèn)知、熟悉的過程嘉裤,然后試用郑临,再決定是否繼續(xù)消費使用,最后成為忠誠用戶
★PEST分析理論主要用于行業(yè)分析屑宠。
★4P分析理論主要用于公司整體經(jīng)營情況分析厢洞。
★邏輯樹分析理論可用于業(yè)務(wù)問題專題分析。
★用戶行為理論的用途較單一典奉,就是用于用戶行為研究分析。
★5W2H分析理論的用途相對廣泛卫玖,可用于用戶行為分析公你、業(yè)務(wù)問題專題分析等。
當(dāng)然假瞬,這些方法論也可以相互嵌套使用陕靠。例如,用邏輯樹分析法搭建分析框架脱茉,而下一層級的問題可以從4P的角度分析剪芥,也可以用5W2H法分解問題。記住根據(jù)實際情況靈活選擇使用琴许,切勿生搬硬套税肪。