相關(guān)系數(shù)
15.1 相關(guān)系數(shù)的概念
著名統(tǒng)計學(xué)家卡爾·皮爾遜設(shè)計了統(tǒng)計指標(biāo)——相關(guān)系數(shù)(Correlation coefficient)桐玻。相關(guān)系數(shù)是用以反映變量之間相關(guān)關(guān)系密切程度的統(tǒng)計指標(biāo)瓤荔。相關(guān)系數(shù)是按積差方法計算,同樣以兩變量與各自平均值的離差為基礎(chǔ),通過兩個離差相乘來反映兩變量之間相關(guān)程度泵琳;著重研究線性的單相關(guān)系數(shù)皂林。
依據(jù)相關(guān)現(xiàn)象之間的不同特征,其統(tǒng)計指標(biāo)的名稱有所不同浴骂。如將反映兩變量間線性相關(guān)關(guān)系的統(tǒng)計指標(biāo)稱為相關(guān)系數(shù)(相關(guān)系數(shù)的平方稱為判定系數(shù));將反映兩變量間曲線相關(guān)關(guān)系的統(tǒng)計指標(biāo)稱為非線性相關(guān)系數(shù)宪潮、非線性判定系數(shù)溯警;將反映多元線性相關(guān)關(guān)系的統(tǒng)計指標(biāo)稱為復(fù)相關(guān)系數(shù)、復(fù)判定系數(shù)等狡相。相關(guān)系數(shù)的計算公式為:
復(fù)相關(guān)系數(shù)(multiple correlation coefficient):反映一個因變量與一組自變量(兩個或兩個以上)之間相關(guān)程度的指標(biāo)梯轻。它是包含所有變量在內(nèi)的相關(guān)系數(shù)。它可利用單相關(guān)系數(shù)和偏相關(guān)系數(shù)求得尽棕。其計算公式為:
當(dāng)只有兩個變量時喳挑,復(fù)相關(guān)系數(shù)就等于單相關(guān)系數(shù)。Excel中的相關(guān)系數(shù)工具是單相關(guān)系數(shù)。
15.2 相關(guān)系數(shù)工具的使用
CORREL 和 PEARSON 工作表函數(shù)均可計算兩個測量值變量之間的相關(guān)系數(shù)伊诵,條件是每種變量的測量值都是對 N 個對象進行觀測所得到的单绑。(丟失任何對象的任何觀測值都會導(dǎo)致在分析中忽略該對象。)相關(guān)系數(shù)分析工具特別適合于當(dāng) N 個對象中的每個對象都有兩個以上的測量值變量的情況曹宴。它提供一張輸出表(相關(guān)矩陣)搂橙,其中顯示了應(yīng)用于每個可能的測量值變量對的 CORREL(或 PEARSON)值。
與協(xié)方差一樣笛坦,相關(guān)系數(shù)是描述兩個測量值變量之間的離散程度的指標(biāo)区转。與協(xié)方差的不同之處在于,相關(guān)系數(shù)是成比例的版扩,因此它的值與這兩個測量值變量的表示單位無關(guān)废离。(例如,如果兩個測量值變量為重量和高度礁芦,當(dāng)重量單位從磅換算成千克時蜻韭,相關(guān)系數(shù)的值并不改變。)任何相關(guān)系數(shù)的值都必須介于 -1 和 +1 之間(包括 -1 和 +1)柿扣。
可以使用相關(guān)系數(shù)分析工具來檢驗每對測量值變量肖方,以便確定兩個測量值變量是否趨向于同時變動,即窄刘,一個變量的較大值是否趨向于與另一個變量的較大值相關(guān)聯(lián)(正相關(guān))窥妇;或者一個變量的較小值是否趨向于與另一個變量的較大值相關(guān)聯(lián)(負(fù)相關(guān));或者兩個變量的值趨向于互不關(guān)聯(lián)(相關(guān)系數(shù)近似于零)娩践。
【例】9個小麥品種(分別用A1,A2,...,A9表示)的6個性狀資料見表活翩,作相關(guān)系數(shù)計算。
表 15-1 試驗數(shù)據(jù)
(1)建立一張工作表翻伺,輸入數(shù)據(jù):
圖 15-1 EXCEL數(shù)據(jù)輸入
(2)從“數(shù)據(jù)”選項卡選擇“數(shù)據(jù)分析”材泄,從“數(shù)據(jù)分析”列表框中選擇“相關(guān)系數(shù)”,單擊“確定”彈出相關(guān)系數(shù)對話框吨岭。
圖 15-2 相關(guān)系數(shù)對話框
數(shù)據(jù)區(qū)域可包括變量名稱拉宗,但不包括樣本編號。每個變量的樣本按行排列的選擇“逐行”按列排列的選擇“逐列”辣辫。若包括變量名稱旦事,則選擇“標(biāo)志位于第一列”
(3)單擊“確定”得偏相關(guān)系數(shù)如下表。
圖 15-3 結(jié)果輸出
Excel分析工具中的“相關(guān)系數(shù)”僅計算出相關(guān)系數(shù)的值急灭,并未進行相關(guān)性檢驗姐浮。相關(guān)系數(shù)檢驗可由相關(guān)系數(shù)臨界值來判斷。
相關(guān)系數(shù)為可決系數(shù)的平方根葬馋,可決系數(shù)為回歸平方和與總誤差平方和之比卖鲤,而F統(tǒng)計量為回歸均方和與總均方和之比肾扰,由于可借助F臨界值求得相關(guān)系數(shù)臨界值。即:
本例中n=9,在G9單元格輸入=SQRT(FINV(0.05,1,7)/(FINV(0.05,1,7)+7))蛋逾,在B12輸入=IF(ABS(B4)>$G$9,"相關(guān)性顯著","不顯著")并復(fù)制集晚,得:
圖 15-4 由函數(shù)判斷顯著性
協(xié)方差
16.1 協(xié)方差的概念
在概率論和統(tǒng)計學(xué)中,協(xié)方差用于衡量兩個變量的總體誤差区匣。而方差是協(xié)方差的一種特殊情況偷拔,即當(dāng)兩個變量是相同的情況。兩個實數(shù)隨機變量X與Y之間的協(xié)方差定義為: COV(X沉颂,Y)=E[(X-E(X))(Y-E(Y))]其中条摸,E是期望值悦污。
16.2 協(xié)方差工具的使用
當(dāng)您對一組個體進行觀測而獲得了 N 個不同的測量值變量時铸屉,“相關(guān)”和“協(xié)方差”工具可在相同設(shè)置下使用∏卸耍“相關(guān)”和“協(xié)方差”工具都會提供一張輸出表(矩陣)彻坛,其中分別顯示每對測量值變量之間的相關(guān)系數(shù)或協(xié)方差。不同之處在于協(xié)方差的取值在 -1 和 +1 之間踏枣,而協(xié)方差沒有限定的取值范圍昌屉。相關(guān)系數(shù)和協(xié)方差都是描述兩個變量離散程度的指標(biāo)。
“協(xié)方差”工具為每對測量值變量計算工作表函數(shù) COVAR 的值茵瀑。(當(dāng)只有兩個測量值變量间驮,即 N=2 時,可直接使用 COVAR马昨,而不要使用“協(xié)方差”工具竞帽。)在“協(xié)方差”工具的輸出表中的第 i 行、第 i 列的對角線上的輸入值是第 i 個測量值變量與其自身的協(xié)方差鸿捧;這正好是用工作表函數(shù) VARP 計算得出的變量的總體方差屹篓。
可以使用“協(xié)方差”工具來檢驗每對測量值變量,以便確定兩個測量值變量是否趨向于同時變動匙奴,即堆巧,一個變量的較大值是否趨向于與另一個變量的較大值相關(guān)聯(lián)(正相關(guān));或者一個變量的較小值是否趨向于與另一個變量的較大值相關(guān)聯(lián)(負(fù)相關(guān))泼菌;或者兩個變量中的值趨向于互不關(guān)聯(lián)(協(xié)方差近似于零)谍肤。
【例】9個小麥品種(分別用A1,A2,...,A9表示)的5個性狀資料見表,作協(xié)方差計算哗伯。
(1)建立一張工作表荒揣,輸入數(shù)據(jù):
圖 16-1 輸入數(shù)據(jù)
(2)從“數(shù)據(jù)”選項卡選擇“數(shù)據(jù)分析”,從“數(shù)據(jù)分析”列表框中選擇“協(xié)方差”笋颤,單擊“確定”彈出協(xié)方差對話框乳附。
圖 16-2 協(xié)方差工具對話框
數(shù)據(jù)區(qū)域可包括變量名稱内地,但不包括樣本編號。每個變量的樣本按行排列的選擇“逐行”按列排列的選擇“逐列”赋除。若包括變量名稱阱缓,則選擇“標(biāo)志位于第一列”
(3)單擊“確定”得協(xié)方差如下表。
圖 16-3 結(jié)果輸出
回歸
17.1 回歸基本公式
對于多元回歸举农,仍可用最小二乘法荆针。
決定系數(shù)與調(diào)整的決定系數(shù):
17.2 回歸工具的使用
“回歸”分析工具通過對一組觀察值使用“最小二乘法”直線擬合來執(zhí)行線性回歸分析。本工具可用來分析單個因變量是如何受一個或幾個自變量的值影響的颁糟。
例:某企業(yè)成本與銷售額如下表(單元:萬元)航背,試進行多元線性回歸。
表 17-1 數(shù)據(jù)資料
(1)打開一張EXCEL表格棱貌,輸入數(shù)據(jù)如下玖媚。
圖 17-1 在EXCEL輸入數(shù)據(jù)
(2)數(shù)據(jù)|分析|數(shù)據(jù)分析|回歸,彈出回歸對話框并設(shè)置如下:
圖 17-2 回歸對話框設(shè)置
(3)單擊“確定”得如下輸出結(jié)果婚脱。
摘要表:
表中Multiple R為復(fù)相關(guān)系數(shù)今魔;R Square為決定系數(shù);Adjusted R Square調(diào)整的決定系數(shù)障贸。
表 17-2 輸出結(jié)果(摘要) SUMMARY OUTPUT
表 17-3 輸入結(jié)果(方差分析表)
參數(shù)值错森、參數(shù)檢驗與置信區(qū)間。
表 17-4 輸出結(jié)果(回歸系數(shù)篮洁、t檢驗及置信區(qū)間
表 17-5 輸出結(jié)果(殘差)RESIDUAL OUTPUT
表中的標(biāo)準(zhǔn)殘差=(殘差-殘差的均值)/殘差的標(biāo)準(zhǔn)差即
圖 17-3 結(jié)果輸出殘差圖
表 17-6 輸入結(jié)果(百分比排位)PROBABILITY OUTPUT
圖 17-4 正態(tài)分布圖