現(xiàn)實(shí)工作中疟羹,人們需要根據(jù)數(shù)值采取行動(dòng)主守。“為什么要進(jìn)行分析”“計(jì)劃根據(jù)分析結(jié)果做什么”榄融,這些視點(diǎn)和思維方式丸逸,對(duì)實(shí)際業(yè)務(wù)中的數(shù)據(jù)分析工作具有極為重要的意義。
10 秒鐘完成一元回歸分析
(1)用散點(diǎn)圖展現(xiàn) 2 個(gè)數(shù)據(jù)間的關(guān)系
(2)用散點(diǎn)圖求回歸方程
一元回歸分析公式用y =ax +b 的形式來(lái)表現(xiàn)這條直線剃袍,這就是回歸方程(由此畫(huà)出的直線叫作回歸直線)黄刚。
x 叫作“自變量”或“解釋變量”,y 叫作“因變量”或“被解釋變量
回歸直線作為零散分布的原始數(shù)據(jù)的代表民效,是距離各點(diǎn)(數(shù)據(jù))之和最小的直線憔维。不過(guò)除非所有數(shù)據(jù)都排列在同一條直線上,否則回歸方程與各點(diǎn)之間就一定會(huì)有偏差畏邢。就這一點(diǎn)而言业扒,回歸方程無(wú)法完美地體現(xiàn)原始數(shù)據(jù)。
如果原始數(shù)據(jù)完全相關(guān)(相關(guān)系數(shù)=1)舒萎,那么所有的點(diǎn)都會(huì)排列在一條直線上程储;但如果不是完全相關(guān),相關(guān)系數(shù)就會(huì)隨著數(shù)據(jù)對(duì)完全相關(guān)(直線)的偏離臂寝,從 1 開(kāi)始逐漸減小章鲤。其實(shí),越偏離直線咆贬,指標(biāo)越小于 1 的現(xiàn)象也適用于一元回歸败徊。數(shù)據(jù)偏離越遠(yuǎn),回歸直線就越不能準(zhǔn)確地代表原始數(shù)據(jù)掏缎,R 2 表示數(shù)據(jù)的偏離程度皱蹦。
關(guān)注相關(guān)系數(shù)的平方
R 2 就是相關(guān)系數(shù)的平方。因此我們對(duì)R 2 也可以采取與相關(guān)系數(shù)相同的評(píng)價(jià)標(biāo)準(zhǔn)眷蜈。如果用百分?jǐn)?shù)(%)表示R 2 沪哺,它可以理解為“被解釋變量”在多大程度上可以由“解釋變量”來(lái)說(shuō)明。
知道達(dá)到目標(biāo)所需要的輸入(為多少酌儒,就可以計(jì)算出需要多少資源辜妓,或者據(jù)此設(shè)定行動(dòng)指標(biāo)(KPI:重要業(yè)績(jī)?cè)u(píng)價(jià)指標(biāo)),從而制定出更為客觀并符合邏輯的計(jì)劃。
注意事項(xiàng)及應(yīng)用事例
運(yùn)用一元回歸分析要注意以下兩個(gè)問(wèn)題嫌拣。
一個(gè)是“數(shù)據(jù)之間必須具有單純的比例關(guān)系”柔袁。與相關(guān)分析一樣,一元回歸分析的大前提是 2 個(gè)數(shù)據(jù)之間存在直線比例關(guān)系异逐。情況或關(guān)系越復(fù)雜捶索,就越不符合嚴(yán)密的線性關(guān)系。這種情況就不適合套用y =ax +b 灰瞻。
還有一個(gè)需注意的問(wèn)題腥例,即“離群值以及不同的數(shù)據(jù)選擇范圍,會(huì)導(dǎo)致分析結(jié)果產(chǎn)生很大不同”酝润。這一點(diǎn)也與相關(guān)分析的注意事項(xiàng)一樣燎竖。是否采納明顯偏離其他數(shù)據(jù)的“離群值”,如何設(shè)定數(shù)據(jù)的范圍要销,分析者的不同判斷會(huì)導(dǎo)致分析結(jié)果出現(xiàn)很大差異构回。也就是說(shuō),分析者每一個(gè)小小的決定都能操縱分析的結(jié)果疏咐。
看相關(guān)系數(shù)還是看斜率
相關(guān)系數(shù)常作為篩選標(biāo)準(zhǔn)纤掸,與 0.7、0.5 等界限值進(jìn)行比較浑塞,只要高于界限值就可以判斷是相關(guān)借跪。由于其中會(huì)包含誤差等,所以并不按照其具體大小進(jìn)行判斷酌壕。對(duì)已經(jīng)確定具有相關(guān)關(guān)系的數(shù)據(jù)掏愁,則可以運(yùn)用回歸分析來(lái)定量地比較或評(píng)價(jià)其影響。也就是說(shuō)卵牍,可以從 2 個(gè)視角來(lái)看果港,用相關(guān)分析判斷關(guān)聯(lián)的緊密程度,用回歸分析判斷其影響大小辽慕。