數(shù)據(jù)分析從最開始的圖表分析出發(fā)虑粥,到更有技術(shù)含量的數(shù)據(jù)挖掘,其目的都是在讓數(shù)據(jù)更好地指導(dǎo)在各行各業(yè)中更好地指導(dǎo)業(yè)務(wù)應(yīng)用软驰。前面的每種思維就像不同角度的工具一樣,在不同方向上讓數(shù)據(jù)發(fā)揮作用簿废。在最后講到的證析思維,就將像一串項鏈一樣络它,把前面的珍珠都穿起來族檬,從源頭出來,來說明數(shù)據(jù)分析是如何從問題到數(shù)據(jù)化戳,再從數(shù)據(jù)到答案的单料。
證析——用數(shù)據(jù)說話的藝術(shù)
證析思維其實就是用數(shù)據(jù)說話的思維,通過數(shù)據(jù)來描述問題点楼,同時也通過數(shù)據(jù)來解答問題扫尖。數(shù)據(jù)能夠發(fā)揮作用的地方很多,從商業(yè)領(lǐng)域到生產(chǎn)領(lǐng)域掠廓,從科學(xué)研究領(lǐng)域再到體育文藝領(lǐng)域换怖。
下面的這個就是在2016年巴西里約奧運會,是數(shù)據(jù)在體育領(lǐng)域大發(fā)光彩的一年却盘,運動員的每個動作都能夠被采集成數(shù)據(jù)狰域,然后加以分析,給出應(yīng)該調(diào)整方向的例子:
從世界冠軍見證析魅力
從奧運的例子能夠看出黄橘,通過量化運動員的在出手速度和角度上的數(shù)據(jù)兆览,并且再進(jìn)行過對比,發(fā)現(xiàn)了應(yīng)該調(diào)整的方向塞关,進(jìn)一步做出整改抬探,于是得到了滿意的結(jié)果。這一套流程下來帆赢,讓數(shù)據(jù)發(fā)揮了閉環(huán)反饋的作用小压。這個正是證析思維的應(yīng)用。
證析椰于,是驗證和分析兩個詞的組合怠益,其含義是量化證據(jù)進(jìn)行分析以影響決策的具體實踐,這個概念出自鄭毅的.《證析:大數(shù)據(jù)與基于證據(jù)的決策》瘾婿。
看起來這個概念蜻牢,比較晦澀,其實就是講的是在決策過程中讓數(shù)據(jù)來說話偏陪。通過用數(shù)據(jù)說明問題抢呆,是理性思考,具有科學(xué)性笛谦,同時也有依據(jù)抱虐。
證析看待問題的思路
證析的目的是解決問題,因此在開展證析以前饥脑,需要正確的理解問題恳邀。在生產(chǎn)生活中懦冰,隨著情況和條件的不同,會有多種多樣的問題存在轩娶,然而按照5W1H邏輯儿奶,可以將問題分為WHAT、WHEN鳄抒、WHO闯捎、WHERE,WHY和HOW六類许溅。
首先是對象問題瓤鼻,即WHAT,問題是要明確如選擇的對象贤重,比如采購什么產(chǎn)品茬祷、投資什么標(biāo)的等。第二是時間問題并蝗,即WHEN祭犯,這個問題需要明確一個具體的時間,比如什么時間下單滚停,工作的工序安排等沃粗。第三是人選問題,即WHO键畴,這里是要確定人員最盅,比如選誰出場,多少個人的成本最低起惕。第三是地址問題涡贱,即WHERE,這里是需要確定具體的地址惹想,比如怎么選址的路徑才最短问词,成本才最低等。再下面是原因激吻嘀粱,即WHY,這里需要找到時間發(fā)生的原因激挪,明白為什么會產(chǎn)生,并對相關(guān)對象進(jìn)行分解和剖析草穆。最后是方法問題灌灾,即HOW搓译,這里是要明確一套做事的做法悲柱,比如制定最優(yōu)的解決方案。
問題驗證的方式
在證析的過程中些己,當(dāng)明確了問題的歸屬后豌鸡,就需要對問題進(jìn)行驗證嘿般。不論哪種問題的類別,可以將所需的答案涯冠,把問題分成定性和定量兩類炉奴。
定性問題是是否屬實的問題,即有或者沒有蛇更。在比如有沒有咳嗽癥狀瞻赶、是否有出口資格,是否能夠得獎等等派任。盡管定性問題是聚焦在一個具體的事件上砸逊,看似與數(shù)字無關(guān),但是可以將有無的情況有個0-1變量來體現(xiàn)掌逛,有是1师逸,無則是0。
在定量問題中豆混,就需要了解問題的具體的數(shù)據(jù)篓像,問題從有沒有進(jìn)一步到了有多少。比如血液的指標(biāo)是多少,銷售額是多少錢,得獎的概率是多少等等躯护。
對問題可以分為定性和定量兩類鸵熟,同樣要來解釋和驗證問題所需的證據(jù),也可以分成定性和定量兩類绵估。
驗證的流程
證析的目的是解決問題,因此整個證析的流程,也是圍繞如何解釋問題养叛,如何發(fā)現(xiàn)解決方案而進(jìn)行。
首先是界定問題宰翅,即明確問題是什么5W1H中哪一類的弃甥,以及問題是定性還是定量的。當(dāng)明確以后汁讼,將問題進(jìn)行數(shù)字化轉(zhuǎn)化淆攻,對定量問題,需要知道得出答案的數(shù)據(jù)嘿架,還需要哪些數(shù)據(jù)瓶珊,同樣作為定性問題,除了明確證據(jù)數(shù)據(jù)來源外耸彪,還需要把定性問題進(jìn)行定量化轉(zhuǎn)化伞芹,如把是否的問題轉(zhuǎn)成0-1變量。
完成問題后,就需要去收集證據(jù)唱较,這里既包含了定性的證據(jù)扎唾,也包含了定量的證據(jù),證據(jù)來源也是豐富多彩的南缓,可以說收集證據(jù)是在證析過程中最花時間和精力的胸遇,獲取了證據(jù)后還要進(jìn)一步整理。
當(dāng)完成了證據(jù)的收集和整理汉形,就是對證據(jù)進(jìn)行分析纸镊,通過對比和拆分,去得出問題的結(jié)果概疆。
當(dāng)產(chǎn)生問題的結(jié)果后薄腻,還需要將結(jié)果放到實際的情況中去應(yīng)用返回。同時有的時候届案,還要不斷重復(fù)這個過程庵楷,此時問題的驗證是一個PDCA循環(huán)問題,在反復(fù)的過程中楣颠,不斷尋求更好的答案尽纽。
界定問題
在界定問題環(huán)節(jié)中,當(dāng)明確了5W1H和是定性定量的性質(zhì)后童漩,接下來就是要將現(xiàn)實中的問題轉(zhuǎn)換成數(shù)學(xué)問題弄贿,問題可以是邏輯關(guān)系也可以是數(shù)據(jù)。
比如對房價是否下降而言矫膨,其背后就是一個對比的式子差凹,即未來房價<現(xiàn)在房價的假設(shè)是否成立,進(jìn)一步地量化則可以轉(zhuǎn)成未來房價低于現(xiàn)在房價的概率侧馅。
當(dāng)明確了問題以后危尿,就是要知道影響問題的因素,這些因素會在后面的證據(jù)收集環(huán)節(jié)去獲取馁痴,比如對房價而言谊娇,就涉及到了人口變化,人力資源價格罗晕,貨幣济欢,土地價格,建筑材料價格等等小渊,這些都需要在后面去進(jìn)行收集法褥。
證據(jù)收集
在界定問題中明確了需要收集的證據(jù)后,就開始了相關(guān)證據(jù)的收集酬屉。由于證析是屬于定量分析半等,因此證據(jù)都將以數(shù)據(jù)的形式被收集,在應(yīng)用的過程中也是以數(shù)據(jù)的形式而存在的。
對證據(jù)而言酱鸭,首先是明確相關(guān)證據(jù);及影響的因素的指標(biāo)垛吗。以房價是否上漲的問題為例凹髓,設(shè)計到的方面有:人口、貨幣怯屉、土地蔚舀、剛才、水泥锨络,以及人力資本等要素赌躺。對這些要素而言,人口包括羡儿,人口數(shù)量礼患,人口流入流出情況,人口未來預(yù)測掠归;貨幣包括缅叠,貨幣數(shù)量,M2增速虏冻,未來存量貨幣預(yù)測肤粱;土地包括,土地供應(yīng)量厨相,土地供應(yīng)量預(yù)測领曼;鋼材包括,鋼材價格蛮穿,鋼材產(chǎn)量庶骄,鋼鐵產(chǎn)能,鋼鐵價格預(yù)測践磅;水泥包括:水泥價格瓢姻,水泥產(chǎn)量,水泥產(chǎn)能音诈,水泥價格預(yù)測幻碱;人力資本包括:人口結(jié)構(gòu),消費水平细溅,工資水平褥傍,人力資本價格預(yù)測。
當(dāng)明確了相關(guān)的指標(biāo)后喇聊,就要到不同的渠道上去獲取這些數(shù)據(jù)恍风,這里包括了國家數(shù)據(jù)庫,上市公司財報,資本市場數(shù)據(jù)朋贬,公開信息凯楔,以及專業(yè)的數(shù)據(jù)庫等等。當(dāng)完成證據(jù)的收集后锦募,就將這些數(shù)據(jù)按照相應(yīng)的標(biāo)準(zhǔn)格式整合在一起摆屯,并進(jìn)行數(shù)據(jù)處理,為后續(xù)的對證據(jù)的分析做準(zhǔn)備糠亩。
證據(jù)分析
完成了證據(jù)收集后虐骑,就要著手對證據(jù)進(jìn)行分析,這里需要根據(jù)問題本身赎线,找到合適的方式分析證據(jù)廷没,從而對問題本身進(jìn)行證實或證偽。
這里有三種方式用于分析證據(jù)垂寥,分別是經(jīng)驗判斷颠黎,即把每個證據(jù)加起來進(jìn)行綜合判定,第二是統(tǒng)計推斷滞项,用統(tǒng)計的方式來發(fā)現(xiàn)問題成立時的指標(biāo)數(shù)據(jù)的分布盏缤,如果達(dá)到了閾值就可以認(rèn)為數(shù)據(jù)是成立的。第三是用數(shù)據(jù)挖掘的方式蓖扑,通過分類或者預(yù)估模型進(jìn)行判斷唉铜。
證據(jù)分析模式
對房價問題而言,經(jīng)驗判斷就是用戶支撐房價上漲的證據(jù)條數(shù)對比支撐房價下跌的證據(jù)條數(shù)律杠,看那個占上風(fēng)潭流。統(tǒng)計推斷就是,根據(jù)過去條件的滿足情況柜去,來看房價上漲時間的占比灰嫉,同時再根據(jù)當(dāng)前的條件滿足情況,來推測上漲可能性嗓奢。而數(shù)據(jù)挖掘則是直接從歷史數(shù)據(jù)中讼撒,得到一個關(guān)于求未來房價低于現(xiàn)在房價的概率公式,這個公式可以表示為:未來房價低于現(xiàn)在房價的概率=f(人口)+f(土地)+f(貨幣)+f(鋼材)+f(水泥)+f(人力資本)+f(其他)股耽。當(dāng)輸入相關(guān)的數(shù)據(jù)后根盒,就能知道概率大小。
得出結(jié)果
獲取了證據(jù)的相關(guān)數(shù)據(jù)后物蝙,就將通過分析模型得出的問題的結(jié)果炎滞,問題結(jié)果可以有兩種呈現(xiàn)方式,第一是定性的方式诬乞,即是否册赛,是什么的具體答案钠导,另外一種方式是定量,即呈現(xiàn)出具體的數(shù)據(jù)森瘪。
在房價問題中牡属,定性的結(jié)果就是下降還是上升。定量的結(jié)果就是未來房價低于當(dāng)前房價的概率扼睬,如果概率大于50%對應(yīng)的就是下降逮栅,而小于等于50%對應(yīng)的就是上漲。
應(yīng)用反饋
當(dāng)?shù)玫阶C析的結(jié)果后痰驱,就要將結(jié)果在實際場合中應(yīng)用,以來確定證析的結(jié)果是否有效瞳浦。
對于結(jié)果的判斷担映,首先是在是時間上進(jìn)行對比,時間上的結(jié)果對比可以把證析結(jié)果與當(dāng)前情況進(jìn)行對比叫潦,以判斷是否有效蝇完。同時針對預(yù)測性的結(jié)果,也要放在未來進(jìn)行對比矗蕊。
在空間維度上短蜕,還需要進(jìn)行對比。通常一組數(shù)據(jù)不能夠完全說明證析的結(jié)果就是有效的傻咖。需要分次分組進(jìn)行多輪的對比朋魔,以確定證析的有效。同時卿操,在這個重復(fù)驗證的過程中警检,也有通過假設(shè)檢驗來說明結(jié)果具有統(tǒng)計意義的情況,這樣可以排除證析的結(jié)果是屬于小概率事件害淤。
當(dāng)完成對比和驗證后扇雕,還可以將證析的過程和證據(jù)的選取過程不斷重復(fù)進(jìn)行,通過這個PDCA的循環(huán)窥摄,不斷來優(yōu)化證析的邏輯和方法镶奉,以提升結(jié)果的準(zhǔn)確性。
證析思維總結(jié)
證析思維是對數(shù)據(jù)分析整個邏輯的梳理和總結(jié)崭放,即應(yīng)該如何讓數(shù)據(jù)分析的思維落地哨苛,并且發(fā)生作用。證析思維中币砂,包括了從問題到答案的全部流程移国,也包括了從方案到落地的所有過程,并以解答問題道伟,獲取證據(jù)為主線迹缀,將其余五種思維互相穿插使碾,大家共同的探求問題的答案。
證析思維不僅僅可以用于數(shù)據(jù)分析的問題祝懂,對于解釋其他的問題也同樣適用票摇,在其他資料中出現(xiàn)的解決問題的七步法和麥肯錫方法都有體現(xiàn)到證析思維的整體邏輯,可以說證析思維是一種通用的解決問題的方式砚蓬。
證析思維首先是界定問題矢门,要明確解決什么問題,其中要將現(xiàn)實問題轉(zhuǎn)換成數(shù)學(xué)模型灰蛙,明確是求絕對值還是相對值祟剔,與此同時還需要知道影響問題的因素。第二步是收集證據(jù)摩梧,即根據(jù)前面找出的影響問題的因素去獲取相關(guān)數(shù)據(jù)物延,并且對數(shù)據(jù)處理為可以進(jìn)行分析的形式。第三步是分析證據(jù)仅父,其實就是用拆分和對比的方式叛薯,并借助相關(guān)的模型來對問題的進(jìn)行證實或者證偽。第四步是得出結(jié)果笙纤,即根據(jù)對證據(jù)的分析耗溜,來得到問題的結(jié)果。其實很多時候?qū)?shù)據(jù)分析的問題要求不高的話省容,到第四步就可以結(jié)束了抖拴。有時為了提高對問題解答的可靠性和科學(xué)性,還需要進(jìn)行應(yīng)用反饋腥椒,即將結(jié)果和實際情況進(jìn)行對比城舞,進(jìn)一步地還可以對分析過程進(jìn)行調(diào)整和優(yōu)化。
房價問題就是一個典型證析思維的應(yīng)用寞酿,股票漲不漲就是在界定問題家夺,然后收集歷史價格,財務(wù)數(shù)據(jù)以及其他經(jīng)濟(jì)數(shù)據(jù)就是收集數(shù)據(jù)伐弹。分析數(shù)據(jù)就是用前面收集的一系列數(shù)據(jù)來證明股票價格和影響因素的關(guān)系拉馋。最后在得出結(jié)果中,用當(dāng)前的關(guān)系來推斷未來股價是否上漲惨好,最后再在未來將實際值和預(yù)測值進(jìn)行對比較煌茴,并且重新調(diào)整分析步驟,這就應(yīng)用反饋日川。
原文轉(zhuǎn)發(fā)蔓腐,功德無量!