全文約7376字堰燎,建議先收藏再看
數(shù)據(jù)分析的下限阻桅,取決于邏輯歸納。與其說提高分析質(zhì)量灾搏,不如說提升邏輯歸納能力泄伪。
邏輯歸納殴蓬,需要擁有良好的邏輯思維,并結(jié)合領(lǐng)域知識形成該領(lǐng)域的分析方法蟋滴。而領(lǐng)域方法染厅,進一步歸納則能夠成為通用了方法論。
關(guān)于數(shù)據(jù)分析津函,本文將從邏輯思維和分析方法2個角度進行解讀肖粮,其中分析方法會介紹數(shù)據(jù)分析前的準(zhǔn)備以及數(shù)據(jù)如何為我們創(chuàng)造長期價值。
一尔苦、數(shù)據(jù)分析應(yīng)有的邏輯思維
邏輯思維涩馆,是在認(rèn)識事物的過程中借助概念、判斷允坚、推理等思維形式反映客觀現(xiàn)實的理性認(rèn)識過程魂那。借助邏輯思維,能夠確立執(zhí)行方向稠项,減少方向的偏移度以及分析的誤差涯雅。
原始的數(shù)據(jù)并沒有太多的價值,它是已經(jīng)發(fā)生的事實或者結(jié)果展运。從中發(fā)掘價值則是數(shù)據(jù)分析的目的活逆。
在數(shù)據(jù)分析中,其過程是與邏輯歸納相近的拗胜,過程如下:
提出問題?分析問題?提出假設(shè)?驗證假設(shè)?輸出結(jié)論
只有具備了良好邏輯思維蔗候,才能更好的幫助我們數(shù)據(jù)分析。認(rèn)識邏輯挤土,先從邏輯論證的三要素開始,如下圖所示:
在訓(xùn)練自己邏輯思維時误算,首先要保證信息的完整性仰美,其次才是討論準(zhǔn)確性。如果陳述和提問不夠清晰儿礼,后續(xù)論證是沒有意義的咖杂。
初步了解了邏輯,接下來將與各位分享4種思維方式以及其運用方法蚊夫,分別是目標(biāo)诉字、結(jié)構(gòu)化、推理、逆向思維壤圃。
01?目標(biāo)思維
目標(biāo)思維陵霉,作用是明確目標(biāo)的定義及完整性,校準(zhǔn)執(zhí)行的方向伍绳。
從邏輯論證的要素來看踊挠,目標(biāo)只是一個論點,而判斷論點是否有效冲杀、正確效床,則需要細(xì)究其論據(jù)和論證方式。
將目標(biāo)映射至三要素并進行結(jié)構(gòu)化拆解权谁,會變成我們熟悉的需求4要素剩檀,再次延伸又會變成5W2H法。
熟練運用目標(biāo)思維旺芽,不僅能幫助我們分析問題沪猴,還能運用于生活的許多方面。
在陳述問題時所使用的KWIC方法甥绿,其實也是邏輯要素的延伸:
1)K(KEY):核心觀點
2)W(Widen):擴展核心觀點包含的內(nèi)容
3)I(Illustrate):舉例說明佐證觀點
4)C(Conclude):總結(jié)
信息越全面字币,溝通的成本越低,后續(xù)的論證質(zhì)量才能更高共缕。
02?結(jié)構(gòu)化思維
目標(biāo)思維強調(diào)的是方向洗出,結(jié)構(gòu)化思維強調(diào)的是拆解和延伸。
在上一節(jié)中目標(biāo)的拆解和延伸使用的就是結(jié)構(gòu)化的思維图谷,它能夠幫助我們將無序翩活、散亂的信息進行聚焦、歸納便贵、分類菠镇。
2-1、問題樹
問題樹承璃,是大家較為熟悉的方法利耍,也是我們常使用的“腦圖”。它是一種以樹狀圖形來分析存在的問題及其相互關(guān)系的方法盔粹,也是邏輯樹的一種類型隘梨。
在邏輯樹中,每一層都是下一層的總結(jié)概括舷嗡,同樹干內(nèi)的延伸范圍相同轴猎,不同樹干的延伸范圍相互獨立。
在使用問題樹時將一個已知問題當(dāng)成樹干进萄,然后根據(jù)相關(guān)問題增加樹干或樹枝捻脖,它能夠幫助我們更全面的找到相關(guān)項锐峭。
設(shè)置第一條樹干時有兩種方式,自上而下以及自下而上可婶。
自上而下其實是以終為始沿癞,通過最終的目標(biāo)進行拆解;自下而上則常見于頭腦風(fēng)暴扰肌,當(dāng)缺少拆解思路時抛寝,我們可以將信息完全羅列,并對其進行歸類逐層向上聚合曙旭。
在拆解時盗舰,我們應(yīng)注意樹干間的平衡,假設(shè)某個樹干上的樹枝過多或過長桂躏,其上層的拆解維度可能是不正確的钻趋。
2-2、公式法及過程法
公式法剂习,是問題樹的一種延伸蛮位。
公式在橫向表示時,我們也稱為金字塔原理鳞绕。
在邏輯樹的使用場景下失仁,公式法不太關(guān)注細(xì)分場景以及整體漏斗。在進行細(xì)化分析時結(jié)合場景们何、操作流程萄焦,對公式進行進一步的細(xì)化。
在結(jié)合過程法時冤竹,須注意的點是完全窮舉拂封。
舉個例子:在活動中分析成交時,會使用訪問人數(shù)鹦蠕、點擊購買按鈕人數(shù)冒签、成交人數(shù)去分析漏斗。但漏斗數(shù)據(jù)往往是不完整的钟病,這會影響推斷的準(zhǔn)確性萧恕。
結(jié)合場景、操作流程并輸出公式進行數(shù)據(jù)分析肠阱,會比漏斗更為直觀票唆。
以下載app后用戶的注冊流程為例,通過上圖辖所,可以拆解出以下公式:
a惰说、app注冊人數(shù)=手機號注冊人數(shù)+微信注冊人數(shù)
b磨德、微信注冊人數(shù)=進入注冊頁面人數(shù)+瀏覽其他頁面引流進入人數(shù)-進入注冊頁面人數(shù)*跳失率-登錄人數(shù)-點擊手機號登錄注冊人數(shù)
c缘回、手機號注冊人數(shù)=進入注冊頁面人數(shù)+瀏覽其他頁面引流進入人數(shù)-進入注冊頁面人數(shù)*跳失率-登錄人數(shù)-點擊微信登錄注冊人數(shù)-進入手機號登錄頁面人數(shù)*跳失率-輸入手機號未獲取驗證碼人數(shù)-獲取驗證碼未輸入人數(shù)-輸入驗證碼未登錄人數(shù)
公式羅列清楚后吆视,代入數(shù)據(jù)就能夠了解是哪個數(shù)據(jù)和我們的預(yù)期不同,然后再根據(jù)數(shù)據(jù)優(yōu)化我們的交互酥宴。
2-3啦吧、二分法及矩陣法
這兩種結(jié)構(gòu)化方式,其實不太適合用于數(shù)據(jù)分析拙寡,但能夠幫助我們梳理思路便于全局思考授滓。
二分法不適用于數(shù)據(jù)分析的原因是,世界不是非黑即白的肆糕,它很難將某個數(shù)據(jù)指標(biāo)的值枚舉完畢般堆。
而矩陣法所呈現(xiàn)的是結(jié)果數(shù)據(jù),難以細(xì)化诚啃。
以時間管理中的四象限法為例:
四個象限能夠很好的用于任務(wù)分類淮摔,關(guān)于“重要”和“緊急”的程度,我們也可以使用坐標(biāo)軸的值進行標(biāo)記始赎,但如果要細(xì)究哪個元素影響了”重要“和”緊急“的值和橙,矩陣法就難以承載了。
03 推理思維
確認(rèn)論點造垛,結(jié)構(gòu)化論據(jù)魔招,下一步是論證。在論證中運用推理思維能夠幫助我們迅速找到問題的異同點五辽,從而發(fā)現(xiàn)它們的規(guī)律办斑。
推理主要使用的方法是歸納、演繹奔脐、類比法俄周,而在推理過程中還貫穿著對因果的辯證。
3-1髓迎、歸納法
歸納法峦朗,指從特殊(部分樣本)到一般(全量樣本)的過程,通俗的說是從個別的經(jīng)驗歸納出普遍規(guī)律的方法排龄。它更偏感性思維波势,其推理方式不夠嚴(yán)謹(jǐn),常用于開拓思路橄维。
在產(chǎn)品工作中我們會遇見許多使用歸納法的情景尺铣,如:“很多用戶都需要這個功能,所以我們應(yīng)該盡快實現(xiàn)争舞×莘蓿”
通過歸納法拆解后如下圖所示:
這實質(zhì)上是以偏概全的方法,一旦有一個用戶不滿足這個前提竞川,這個結(jié)論就無法成立店溢。
這里并不是說如果有用戶不需要這個功能需求就不承接了叁熔,而是要增加更多的衡量維度,如樣本數(shù)量床牧、樣本占比荣回、投入產(chǎn)出比等。
在輸出結(jié)論之前需要判斷樣本是否足夠有代表性戈咳,判斷是必然事件還是隨機事件心软。
這也是為什么數(shù)據(jù)分析需要長時間的收集樣本并觀察數(shù)據(jù),樣本量太小會使其代表性不足著蛙,觀察周期太短會被數(shù)據(jù)的波動所迷惑删铃,很容易讓我們做出錯誤的判斷。
3-2踏堡、演繹法
演繹法則與歸納法相反,是從既有經(jīng)證實的普遍性結(jié)論泳姐,推導(dǎo)出個別性結(jié)論的一種方法,常見的表現(xiàn)形式是邏輯三段論暂吉。
邏輯三段論的格式為:大前提胖秒、小前提、結(jié)論慕的。
假設(shè)大前提為真阎肝,小前提為真,那結(jié)論一定為真肮街。演繹法追求的是前后一致风题,不自相矛盾,但大部分人都倒在了第一步嫉父,即大前提本身是不成立的沛硅。
不成立的原因是,大前提并非經(jīng)證實的普遍性結(jié)論绕辖,而是通過歸納法輸出的結(jié)論摇肌。要避開歸納法的陷阱,我們則需要對其因果進行辯證仪际。
3-3围小、因果關(guān)系分析法
因果辯證,同時適用于演繹和歸納法树碱,它們都是由因及果的過程肯适。
近期互聯(lián)網(wǎng)保險的營銷活動由于監(jiān)管原因,無法使用現(xiàn)金及優(yōu)惠券獎品促進成交成榜,一定程度上減少了活動的數(shù)量框舔。
我們試著拆解出可能的因果關(guān)系:
拆解完畢后先不進行辯證,而是先對因果關(guān)系進行枚舉:
枚舉完畢后,辯證時提問3個問題:
1)原因是否真實刘绣?
2)結(jié)果是否真實
3)這個原因一定會引起這個結(jié)果嗎钳垮?是否有其他的原因?
在上述的案例中假設(shè)原因和結(jié)果都為真额港,套入第3點做出以下提問:
1)使用現(xiàn)金及優(yōu)惠券獎品,一定會使成交效果更好嗎歧焦,是否有其他的方式移斩?
2)不使用這2種獎品,活動一定不能做嗎绢馍,是否有其他的獎品向瓷?
3)活動沒法做,一定不能促進成交嗎舰涌,是否有其他的方式猖任?
看到這里,我們會發(fā)現(xiàn)這些原因只是結(jié)果的必要不充分條件瓷耙。
在推理中朱躺,論證完畢也不應(yīng)蓋棺定論。
我們應(yīng)先對結(jié)論提出假設(shè)搁痛,并設(shè)計實驗或采取其他的手段驗證假設(shè)长搀,最終驗證后的結(jié)果才是真正的結(jié)論。
04?逆向思維法
“反過來想鸡典,總是反過來想源请。”— — 查理·芒格
逆向思維彻况,同時具有聚焦和發(fā)散兩種作用谁尸。
聚焦,是以終為始纽甘,問題樹中的“自上而下”拆解是其表現(xiàn)形式之一良蛮。
發(fā)散,是因為從正向思考變?yōu)槟嫦蛩伎己酚伎剂?xí)慣的改變能夠開拓我們的思路背镇,并幫助我們補全邏輯。
在數(shù)據(jù)分析中泽裳,我們能夠怎么使用逆向思維呢瞒斩?
個人總結(jié)的逆向方法如下:
1)主賓反轉(zhuǎn)
正向:用戶購買商品數(shù)量提升了,為什么涮总?
逆向:商品被用戶購買的數(shù)量提升了胸囱,為什么?
從用戶出發(fā)并沒有錯誤瀑梗,從商品出發(fā)能幫助我們補全分析的維度烹笔。
2)謂語反轉(zhuǎn)
正向:活躍度降低了裳扯,分析用戶進入活動入口
逆向:活躍度降低了,分析用戶的跳出原因
同樣是活躍度降低谤职,”進入“這個詞會從入口出發(fā)饰豺,分析其流量情況。從”跳出“出發(fā)允蜈,則會從交互冤吨、設(shè)計層面出發(fā)分析。
3)次序反轉(zhuǎn)
正向:引導(dǎo)用戶成交饶套,捐款后獲得獎品
逆向:給予用戶獎品后漩蟆,引導(dǎo)用戶成交
這里的逆向主要是為了開拓思路,并不是說要直接給予用戶獎品妓蛮。在開拓思路后進一步延伸怠李,方案可以調(diào)整為,給予用戶部分獎品蛤克,成交后再給予另一部分捺癞。
小結(jié)
校正方向,使用目標(biāo)思維构挤;分解問題和提出假設(shè)翘簇,使用結(jié)構(gòu)化思維;邏輯推理用于論證儿倒,而逆向思維則用于補全我們的邏輯版保。
良好的邏輯思維,結(jié)合領(lǐng)域知識能夠幫助我們快速形成不同領(lǐng)域的方法夫否,并解決問題彻犁。
二、數(shù)據(jù)分析的方法
01 ?數(shù)據(jù)分析前的準(zhǔn)備
數(shù)據(jù)分析前的準(zhǔn)備過程凰慈,在我看來比實際的分析更為重要汞幢。
假設(shè)目標(biāo)是錯的,我們就不應(yīng)該執(zhí)行微谓。而目標(biāo)不同森篷,分析類型和分析內(nèi)容也不同,同時執(zhí)行多個方向豺型,很容易使自己陷入混亂仲智。
1-1、定義目標(biāo)姻氨,辨別指標(biāo)
數(shù)據(jù)分析钓辆,能幫助我們了解業(yè)務(wù)運行狀況,并從中發(fā)現(xiàn)問題、優(yōu)化問題前联。其次功戚,還能夠幫助洞察下一個增長點。
但數(shù)據(jù)分析的意義似嗤,往往在數(shù)據(jù)產(chǎn)生之前啸臀。我們應(yīng)圍繞產(chǎn)品目標(biāo),進行產(chǎn)品設(shè)計以及運營策劃烁落。如果最開始的目標(biāo)及指標(biāo)設(shè)置錯誤乘粒,后續(xù)的工作將難以為繼。
目標(biāo)是結(jié)果顽馋,而指標(biāo)是對結(jié)果分拆的具體要求,是對目標(biāo)的衡量幌羞。
假設(shè)我們的目標(biāo)是提升年度成交金額寸谜,那衡量這個目標(biāo)的方法是什么呢?
根據(jù)衡量的方法我們才能定向的設(shè)置調(diào)整產(chǎn)品設(shè)計及運營策略属桦。如果缺少可衡量目標(biāo)的單位和方法熊痴,目標(biāo)會難以達(dá)成。
而圍繞目標(biāo)設(shè)置數(shù)據(jù)的采集方案聂宾,可以大大節(jié)省數(shù)據(jù)過濾和清洗的時間果善。
甚至于在明確指標(biāo)后再最開始就設(shè)置好分析模型,通過監(jiān)測模型中的數(shù)據(jù)情況更及時的發(fā)現(xiàn)問題系谐,做出更高質(zhì)巾陕、高效的決策。
1-2纪他、辨別指標(biāo)的目的
辨別了目標(biāo)和指標(biāo)鄙煤,下一步則是運用結(jié)構(gòu)化思維進行拆解、延伸茶袒。
在拆解之前梯刚,需要對自己提問:拆解出的指標(biāo)目的是什么?根據(jù)目的我們才能有傾向性的分析薪寓。
根據(jù)指標(biāo)目的亡资,可以分為結(jié)果指標(biāo)、過程指標(biāo)以及觀察指標(biāo)向叉。
結(jié)果指標(biāo)用于衡量目標(biāo)锥腻,過程指標(biāo)用于體現(xiàn)如何完成。觀察指標(biāo)則指的受影響指標(biāo)母谎,其是否會受到自變量(結(jié)果指標(biāo))的影響旷太,導(dǎo)致上升或下降。
在上圖中,基于成交訂單數(shù)供璧,設(shè)置過程指標(biāo)為訂單平均金額及商品分布能幫助我們了解完成的方式存崖。
而觀察指標(biāo)的設(shè)置,是為了跳出框架思考睡毒。
上圖的用戶付費率来惧,可以監(jiān)測成交訂單數(shù)上升,是否帶動用戶付費率的上升演顾,從而判斷是局部還是整體上升供搀;而成交深度及ARPU/LTV則可以幫助我們考察下一個增長點是什么。
在設(shè)置結(jié)果指標(biāo)時钠至,除了核心指標(biāo)葛虐,還應(yīng)輔以制衡性指標(biāo),它的目的是希望核心指標(biāo)完成的更為健康棉钧。
核心指標(biāo)和制衡性指標(biāo)所延展的過程屿脐、觀察指標(biāo)是不同的。
1-3宪卿、確認(rèn)分析類型
完成了目標(biāo)和指標(biāo)的設(shè)置的诵,接下來是對每個指標(biāo)進行細(xì)化分析,分析類型包含:描述性分析佑钾、預(yù)測性分析和規(guī)范性分析西疤。類型不同,作用也不同休溶。
1)描述性分析
表現(xiàn)形式:數(shù)據(jù)報表
數(shù)據(jù)報表能夠幫助我們描述事件發(fā)展的情況代赁,但很難解釋某種結(jié)果發(fā)生的原因和未來可能的趨勢。
它更偏向結(jié)果性的描述兽掰,此前的結(jié)果對此后是不具備太多參考意義的管跺。
2)預(yù)測性分析
表現(xiàn)形式:用戶相似度及物品相似度計算、用戶購買飽和度禾进、用戶成交影響因子
預(yù)測性分析可以理解為對結(jié)果和變量的關(guān)系進行預(yù)測的過程豁跑,包含相似度、相關(guān)性分析泻云、回歸分析等艇拍。
相似度多用于推薦算法,通過計算用戶的相似度和商品相似度從而推薦給用戶宠纯。而相關(guān)分析用于預(yù)測變量的關(guān)聯(lián)性卸夕,如用戶的成交會受什么因素影響。
3)實證性分析及規(guī)范性分析
表現(xiàn)形式:A/B實驗
實證性分析婆瓜,指是什么快集,偏向于客觀贡羔;規(guī)范性分析指應(yīng)當(dāng)做什么,偏向于主觀个初。
在實際使用過程乖寒,上述的4種分析類型常常會被混合使用,混合使用時應(yīng)明確不同類型我們應(yīng)采取的分析維度院溺。
數(shù)據(jù)分析是有順承關(guān)系的楣嘁,先采集事實,再根據(jù)事實或者預(yù)測珍逸,提出我們的假設(shè)逐虚。逐步灰度地驗證假設(shè),最終才輸出我們的結(jié)論谆膳。
不能將主觀猜測強加于事實之上叭爱,已經(jīng)發(fā)生的結(jié)果并不一定是未來的結(jié)果
02 數(shù)據(jù)分析如何帶來長期價值
學(xué)習(xí)了方法,做好了準(zhǔn)備漱病,終于進入了分析的環(huán)節(jié)买雾。
筆者此前面向的數(shù)據(jù)分析,常常是“一錘子買賣”缨称,花了很大的力氣采集數(shù)據(jù)卻沒有了下文凝果。
為了使有用功更多祝迂,下文將從用戶和收益2個維度分享數(shù)據(jù)如何為我們沉淀長期價值睦尽。
2-1、了解我們的用戶
這一步是為了讓我們知道完成指標(biāo)的用戶是誰型雳,常常以產(chǎn)品的會員體系作為切入點当凡。會員體系越清晰,分析效果越好纠俭。
本節(jié)將以電商產(chǎn)品為例沿量,和各位分享如何基于用戶的延伸分析。
1)基礎(chǔ)信息
基礎(chǔ)信息冤荆,指用戶本身的屬性朴则。
身份特征,可以從自然屬性钓简、社會屬性向下細(xì)分乌妒,包含用戶的性別、年齡外邓、職業(yè)撤蚊、教育等。
渠道屬性损话,指用戶的注冊時間侦啸、注冊平臺槽唾、注冊來源等。
2)決策類型
決策類型光涂,主要分為決策周期庞萍、品類偏好、促銷偏好顶捷、對象偏好挂绰,這是用戶分析中常常被忽略的一方面。
決策周期中的首次訪問服赎,指的首次觸及該商品的時間葵蒂。結(jié)合次數(shù)、時長以及成交時間重虑,從而了解用戶的決策周期践付。
品類偏好,結(jié)合品牌和歷史成交單數(shù)缺厉,能夠幫助我們獲悉品牌永高、價格綜合對用戶的影響。
而成交品類提针、商品命爬、單數(shù)則是幫助我們理解其品類購買深度及路徑,用于進行關(guān)聯(lián)推薦和評判用戶的價值辐脖。
促銷偏好饲宛,結(jié)合品類和折扣金額了解用戶的敏感度,能更好的提高其轉(zhuǎn)化率嗜价。對象偏好艇抠,同樣是了解購買深度及路徑,不過維度不同久锥。
在用戶層面的分析家淤,此前接觸的一些朋友都非常熱衷于使用RFM模型,在使用過程中也應(yīng)“因地制宜”瑟由。
3)購買路徑
品類深度絮重、對象深度是影響決策類型的因子,當(dāng)它們在購買路徑時則聚焦于次序歹苦。
根據(jù)次序青伤,制定運營的發(fā)力點,再遵循用戶的購買路徑制定轉(zhuǎn)化路徑暂氯。
在用戶分布相對穩(wěn)定的前提下叉钥,應(yīng)順從用戶的購買規(guī)律而非傾力于另一條主線掌逛。
一專多強的前提是專畏线,只有聚焦優(yōu)勢品類或主題建立了優(yōu)勢,才能為其他的方向供應(yīng)炮彈究流。
4)增長觀察
前面解決的問題是:他是誰,買什么以及怎么買动遭。最后一點芬探,則是增長觀察。
購買路徑聚焦于次序厘惦,增長觀察聚焦于深度偷仿。購買的次序是運營的主線,購買的深度用于精細(xì)化運營宵蕉。
了解用戶在品類和對象的購買深度酝静,再輔以ARPU與LTV的比對,從用戶的剩余潛力尋找平臺增長點的方式羡玛。
2-2别智、建立你的用戶模型
了解用戶的下一步,是建立用戶模型稼稿。
在一次交流會上薄榛,前輩阿翹對我提問:“你所負(fù)責(zé)的產(chǎn)品,用戶畫像是怎么樣的让歼?”
當(dāng)時我把平臺用戶的地域敞恋、年齡、性別等分布介紹了一番谋右。緊接著他提問:“根據(jù)這樣的畫像你能夠做什么呢硬猫?”
再后來,我才學(xué)會了把數(shù)據(jù)聚合成特征倚评,把特征集合成模型浦徊。
基于對用戶的認(rèn)識建立模型馏予,以上一小節(jié)的決策模型為例天梧。
將決策類型、品類偏好霞丧、對象偏好呢岗、促銷偏好4個因子的關(guān)聯(lián),并輔以用戶的基礎(chǔ)信息進行組合蛹尝。
如:“精打細(xì)算后豫、專注大牌、疼愛孩子的母親”突那。
這樣一來冰冷的數(shù)據(jù)也被賦予了情感化的表達(dá)挫酿,無論是產(chǎn)品設(shè)計、交互設(shè)計愕难、產(chǎn)品運營都會變得容易的多早龟。
建立起用戶模型惫霸,才能夠更好地進行情感化設(shè)計、精細(xì)化運營葱弟。
2-3壹店、分析與收益相關(guān)的行為
收益,常用成交或ROI進行衡量芝加。那我們怎么判斷與收益相關(guān)的行為呢硅卢?有關(guān)程度又有多高?
判斷相關(guān)性及其程度時藏杖,使用的方法是:相關(guān)性分析将塑。
相關(guān)性分析主要用于:
a、判斷兩個或多個變量之間的統(tǒng)計學(xué)關(guān)聯(lián)蝌麸;
b抬旺、如果存在關(guān)聯(lián),進一步分析關(guān)聯(lián)強度和方向祥楣。
根據(jù)數(shù)據(jù)的類型不同开财,所采取分析方法不同。
關(guān)于收益及影響收益的行為误褪,二者都屬于無序分類變量责鳍,此類數(shù)據(jù)的分析方法是卡方校驗。
卡方檢驗兽间,用于統(tǒng)計樣本的實際觀測值與理論推斷值之間的偏離程度历葛,如果卡方值越大,實際觀測值與理論推斷值偏差程度越大嘀略。
反之恤溶,二者偏差越小帜羊;若兩個值完全相等時咒程,卡方值就為0,表明理論值完全符合讼育。
在實際分析時帐姻,會先進行假設(shè),并通過計算判定其假設(shè)成立的概率從而反推其不成立的概率奶段。
以判定關(guān)注與成交行為是否有關(guān)為例饥瓷,介紹卡方校驗。
1)提出假設(shè)假設(shè):關(guān)注與成交無關(guān)
2)計算實際觀測數(shù)據(jù)及理論推測數(shù)據(jù)將關(guān)注及成交的相關(guān)數(shù)據(jù)進行統(tǒng)計痹籍,可得出下表:
根據(jù)表格呢铆,可計算出綜合的成交率等于58.3%。
假設(shè)關(guān)注與成交行為無關(guān)蹲缠,成交率應(yīng)不隨關(guān)注行為變化而變化棺克,或數(shù)據(jù)抖動較小鳖宾。
將觀測的成交率代入原表,并得出理論推斷值逆航。
完成了這一步鼎文,就可以進行卡方檢驗的計算了。
3)卡方校驗計算
繼續(xù)代入公式
當(dāng)我們計算出卡方值時因俐,可以初步判定由于卡方值較大拇惋,實際觀測值與理論推斷值差異較為明顯,原假設(shè)關(guān)注與成交無關(guān)成立的可能性是比較小的抹剩。
4)計算自由度及P值
而到了判定可能性具體的程度撑帖,則是根據(jù)P值(用于判斷判定假設(shè)檢驗結(jié)果)進行校驗,P值越小澳眷,原假設(shè)關(guān)注與成交無關(guān)的概率也越小胡嘿。
由于其自由度等于1,結(jié)合卡方值再查詢卡方分布表可得P<0.01钳踊,所以原假設(shè)成立的可能也越小衷敌,即關(guān)注與成交有關(guān)的概率非常大。
在實際使用時拓瞪,同樣的也須兼顧樣本和觀測時間周期缴罗,樣本包含準(zhǔn)確性和數(shù)量,觀測時間周期則用于分辨其抖動性祭埂。這2者較為基礎(chǔ)也就不過多描述了面氓。
相關(guān)性分析,用于代表相關(guān)程度蛆橡,只能說明有關(guān)但并不能說明因果性舌界。
對變量之間的依賴關(guān)系進行定量關(guān)系及因果關(guān)系的研究,我們還會使用回歸分析進行計算泰演。但由于計算方式并非本文的重心呻拌,在此也不過多的贅述了。
本小節(jié)粥血,也有較多的概念概念并未在本文提及柏锄,此部分將附在文末酿箭。
小結(jié)
個人認(rèn)為數(shù)學(xué)方法是非常重要的領(lǐng)域知識复亏,很多時候不是不會數(shù)據(jù)分析,而是不知道使用什么方法分析缭嫡。因為不曾見過缔御,所以也未曾往陌生的方向思考。
遇到這樣的問題時妇蛀,先運用逆向思維確認(rèn)分析目標(biāo)耕突,其次再進行結(jié)構(gòu)化的拆解笤成,再逐層學(xué)習(xí)分析時應(yīng)該使用的方法。
若時間寬裕眷茁,還是建議閱讀統(tǒng)計學(xué)相關(guān)的書籍炕泳。耐下性子閱讀,工具書的收益會比大部分同領(lǐng)域的文章都大上祈。
寫在最后
這篇文章寫完培遵,前后花了大半年時間的《產(chǎn)品經(jīng)理的能力模型》專題也就結(jié)束了。
下一個階段登刺,專欄將更垂直于產(chǎn)品運營籽腕。也由于今年的重心是學(xué)習(xí),本就不快的發(fā)文頻率可能會再次減緩纸俭,也請多多擔(dān)待皇耗。
參考資料
1、相關(guān)性分析
https://zhuanlan.zhihu.com/p/94070722
2揍很、數(shù)據(jù)的類型
https://blog.csdn.net/weixin_34203832/article/details/88687669
3郎楼、統(tǒng)計學(xué)——卡方檢驗和卡方分布
https://blog.csdn.net/snowdroptulip/article/details/78770088
4、自由度計算
https://www.cnblogs.com/mahailuo/p/10932026.html
5窒悔、什么是P值
https://baike.baidu.com/item/P%E5%80%BC/7083622?fr=aladdin
6箭启、什么是A/B測試
https://www.zhihu.com/question/20045543
7、回歸分析
http://www.reibang.com/p/bbe0c702b5ad