變量間的關(guān)系可以分為兩種:函數(shù)關(guān)系與相關(guān)關(guān)系横殴。函數(shù)關(guān)系是一一對應(yīng)的確定關(guān)系昆禽,然而實(shí)際中變量間的關(guān)系往往比較復(fù)雜,數(shù)量關(guān)系不確定择卦,這種變量間的不確定的數(shù)量關(guān)系稱為相關(guān)關(guān)系敲长。
相關(guān)與回歸分析是數(shù)值型自變量與數(shù)值型因變量之間關(guān)系的分析方法。兩者存在許多聯(lián)系秉继,而兩者之間的主要不同在于相關(guān)分析的目的在于測量變量間的關(guān)系強(qiáng)度祈噪,所使用的測度工具是相關(guān)系數(shù);回歸分析則側(cè)重考察變量間的數(shù)量關(guān)系秕噪,并通過一定的數(shù)學(xué)表達(dá)式進(jìn)行描述钳降,從而確定自變量對因變量的影響程度。相關(guān)分析可以說是回歸分析的基礎(chǔ)和前提腌巾,而回歸分析則是相關(guān)分析的深入和繼續(xù)遂填。當(dāng)兩個或兩個以上的變量之間存在高度的相關(guān)關(guān)系時,進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義澈蝙。
相關(guān)分析是對兩個變量間線性關(guān)系的描述與度量吓坚,它解決的問題包括:1.變量間是否存在關(guān)系;2.如果存在關(guān)系灯荧,它們的關(guān)系是什么礁击;3.變量間關(guān)系的強(qiáng)度是什么;4.樣本所反映的變量間的關(guān)系能否代表總體變量間的關(guān)系逗载。
為解決這些問題哆窿,需要先對總體進(jìn)行以下兩個假設(shè):1. 兩個變量之間是線性關(guān)系;2. 兩個變量都是隨機(jī)變量厉斟。
相關(guān)分析挚躯,常用的方法類別有:簡單相關(guān)分析、偏相關(guān)分析擦秽、距離相關(guān)分析等码荔,其中前兩種方法比例常見。簡單相關(guān)分析感挥,是直接計(jì)算兩個變量的相關(guān)程度缩搅;偏相關(guān)分析,是在排除某個因素后触幼,兩個變量的相關(guān)程度硼瓣;距離相關(guān)分析,是通過兩個變量之間的距離來評估其相似性置谦。
在進(jìn)行相關(guān)分析是巨双,1.首先繪制散點(diǎn)圖來判斷變量間的關(guān)系形態(tài)噪猾;2。判斷是線性關(guān)系則可以利用相關(guān)系數(shù)來測度關(guān)系間的強(qiáng)度筑累;3.隨后對相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn),以判斷樣本所反映的關(guān)系能否代表兩個變量總體的關(guān)系丝蹭。
散點(diǎn)圖
散點(diǎn)圖是描述變量之間關(guān)系的一種直觀方法慢宗,可以大體上反映變量間的關(guān)系形態(tài)及關(guān)系強(qiáng)度。
相關(guān)系數(shù)
相關(guān)系數(shù)是根據(jù)樣本數(shù)據(jù)計(jì)算的度量兩個變量間線性相關(guān)關(guān)系強(qiáng)度的統(tǒng)計(jì)量奔穿。根據(jù)數(shù)據(jù)的大小可以分為總體相關(guān)系數(shù)與樣本相關(guān)系數(shù)镜沽。
線性相關(guān)系數(shù)( Pearson's correlation coefficient )的性質(zhì):1.取值在[-1,1]; 2. 大小與變量的原點(diǎn)及尺度無關(guān); 3. 僅能描述線性關(guān)系贱田,不能描述非線性關(guān)系缅茉;4. 線性相關(guān)關(guān)系不代表因果關(guān)系。
顯著性檢驗(yàn)
用于考察樣本相關(guān)系數(shù)是否能代表總體相關(guān)系數(shù)男摧。