用皮爾遜積描述變量的相關(guān)關(guān)系

摘要:記錄了用皮爾遜積描述變量的相關(guān)關(guān)系的理論依據(jù)、計(jì)算方式以及在Java環(huán)境的代碼示例驮樊,同時(shí)也說明了約束條件好啰、缺點(diǎn)涡驮。

相關(guān)系數(shù)(Correlation coefficient)

  • 相關(guān)表和相關(guān)圖可反映兩個(gè)變量之間的相互關(guān)系及其相關(guān)方向,但無法確切地表明兩個(gè)變量之間相關(guān)的程度宝与。

  • 著名統(tǒng)計(jì)學(xué)家卡爾·皮爾遜設(shè)計(jì)了統(tǒng)計(jì)指標(biāo)——相關(guān)系數(shù)焚廊。相關(guān)系數(shù)是用以反映變量之間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)指標(biāo)。相關(guān)系數(shù)是按積差方法計(jì)算习劫,同樣以兩變量與各自平均值的離差為基礎(chǔ)咆瘟,通過兩個(gè)離差相乘來反映兩變量之間相關(guān)程度;著重研究線性的單相關(guān)系數(shù)诽里。

  • 依據(jù)相關(guān)現(xiàn)象之間的不同特征袒餐,其統(tǒng)計(jì)指標(biāo)的名稱有所不同。如將反映兩變量間線性相關(guān)關(guān)系的統(tǒng)計(jì)指標(biāo)稱為相關(guān)系數(shù)(相關(guān)系數(shù)的平方稱為判定系數(shù))谤狡;將反映兩變量間曲線相關(guān)關(guān)系的統(tǒng)計(jì)指標(biāo)稱為非線性相關(guān)系數(shù)灸眼、非線性判定系數(shù);將反映多元線性相關(guān)關(guān)系的統(tǒng)計(jì)指標(biāo)稱為復(fù)相關(guān)系數(shù)墓懂、復(fù)判定系數(shù)等焰宣。

相關(guān)系數(shù)的計(jì)算方法

相關(guān)系數(shù)的計(jì)算方法
  • 相關(guān)系數(shù)的值介于–1與+1之間,即–1≤r≤+1捕仔。其性質(zhì)如下:
    • 當(dāng)r>0時(shí)匕积,表示兩變量正相關(guān)盈罐,r<0時(shí),兩變量為負(fù)相關(guān)闪唆。
    • 當(dāng)|r|=1時(shí)盅粪,表示兩變量為完全線性相關(guān),即為函數(shù)關(guān)系苞氮。
    • 當(dāng)r=0時(shí)湾揽,表示兩變量間無線性相關(guān)關(guān)系。
    • 當(dāng)0<|r|<1時(shí)笼吟,表示兩變量存在一定程度的線性相關(guān)库物。且|r|越接近1,兩變量間線性關(guān)系越密切贷帮;|r|越接近于0戚揭,表示兩變量的線性相關(guān)越弱。
  • 相關(guān)系數(shù)一般可按三級(jí)劃分:|r|<0.4為低度線性相關(guān)撵枢;0.4≤|r|<0.7為顯著性相關(guān)民晒;0.7≤|r|<1為高度線性相關(guān)。

使用案例

廣告費(fèi)與月平均銷售額相關(guān)表锄禽,單位:萬元

年廣告費(fèi)投入 月均銷售額
12.5 21.2
15.3 23.9
23.2 32.9
26.4 34.1
33.5 42.5
34.4 43.2
39.4 49.0
45.2 52.8
55.4 59.4
60.9 63.5
計(jì)算過程

相關(guān)系數(shù)為0.9942潜必,說明廣告投入費(fèi)與月平均銷售額之間有高度的線性正相關(guān)關(guān)系。

代碼示例

public class Pearson {
    /**
     * 計(jì)算兩組數(shù)據(jù)的皮爾遜積相關(guān)性
     * @param firstRow 第一組數(shù)據(jù)
     * @param secondRow 第二組數(shù)據(jù)
     * @return
     */
    public static double GetPearson(List<String> firstRow, List<String> secondRow) {
        // 兩組數(shù)據(jù)平均值
        double averageFirst = 0.0;
        double averageSecond = 0.0;
        // 分子
        double sumNumerator = 0.0;
        // 分母
        double sumDenominator = 0.0;
        // 若兩列數(shù)據(jù)長(zhǎng)度不同沃但,僅取較短長(zhǎng)度進(jìn)行計(jì)算
        int compareLenth = firstRow.size() > secondRow.size() ? secondRow.size() : firstRow.size();

        for (int tempValue = 0; tempValue < compareLenth; tempValue++) {
            averageFirst += Double.valueOf(firstRow.get(tempValue));
            averageSecond += Double.valueOf(secondRow.get(tempValue));
        }
        //計(jì)算平均值
        averageFirst = averageFirst / compareLenth;
        averageSecond = averageSecond / compareLenth;
        // 分子
        for (int tempValue = 0; tempValue < compareLenth; tempValue++) {
            sumNumerator += (Double.valueOf(firstRow.get(tempValue)) - averageFirst) * (Double.valueOf(secondRow.get(tempValue)) - averageSecond);
        }
        // 分母
        double tempA = 0;
        double tempB = 0;
        for (int tempValue = 0; tempValue < compareLenth; tempValue++) {
            tempA += Math.pow((Double.valueOf(firstRow.get(tempValue)) - averageFirst), 2);
            tempB += Math.pow((Double.valueOf(secondRow.get(tempValue)) - averageSecond), 2);
        }
        sumDenominator = Math.sqrt(tempA) * Math.sqrt(tempB);
        return sumNumerator / sumDenominator;
    }
}

皮爾遜相關(guān)系數(shù)的約束條件

  • 兩個(gè)變量間有線性關(guān)系
  • 變量是連續(xù)變量
  • 變量均符合正態(tài)分布,且二元分布也符合正態(tài)分布
  • 兩變量獨(dú)立磁滚。在實(shí)踐統(tǒng)計(jì)中一般只輸出兩個(gè)系數(shù),一個(gè)是相關(guān)系數(shù)也就是計(jì)算出來的相關(guān)系數(shù)大小(在-1到1之間),另一個(gè)是獨(dú)立樣本檢驗(yàn)系數(shù)宵晚,用來檢驗(yàn)樣本一致性垂攘。

相關(guān)系數(shù)的缺點(diǎn)

  • 需要指出的是,相關(guān)系數(shù)有一個(gè)明顯的缺點(diǎn)淤刃,即它接近于1的程度與數(shù)據(jù)組數(shù)n相關(guān)晒他,這容易給人一種假象。因?yàn)橐菁郑?dāng)n較小時(shí)陨仅,相關(guān)系數(shù)的波動(dòng)較大,對(duì)有些樣本相關(guān)系數(shù)的絕對(duì)值易接近于1铝侵;當(dāng)n較大時(shí)掂名,相關(guān)系數(shù)的絕對(duì)值容易偏小。特別是當(dāng)n=2時(shí)哟沫,相關(guān)系數(shù)的絕對(duì)值總為1饺蔑。因此在樣本容量n較小時(shí),我們僅憑相關(guān)系數(shù)較大就判定變量x與y之間有密切的線性關(guān)系是不妥當(dāng)?shù)摹?/p>

  • 例如嗜诀,就我國(guó)深滬兩股市資產(chǎn)負(fù)債率與每股收益之間的相關(guān)關(guān)系做研究猾警。發(fā)現(xiàn)1999年資產(chǎn)負(fù)債率前40名的上市公司孔祸,二者的相關(guān)系數(shù)為r=–0.6139;資產(chǎn)負(fù)債率后20名的上市公司发皿,二者的相關(guān)系數(shù)r=0.1072崔慧;而對(duì)于滬、深全部上市公司(基金除外)結(jié)果卻是穴墅,r滬=–0.5509惶室,r深=–0.4361,根據(jù)三級(jí)劃分方法玄货,兩變量為顯著性相關(guān)皇钞。這也說明僅憑r的計(jì)算值大小判斷相關(guān)程度有一定的缺陷。

參考文獻(xiàn)

  • 郭紅霞.相關(guān)系數(shù)及其應(yīng)用.武警工程學(xué)院學(xué)報(bào).2010年3月,第26卷第2期
  • 王愛蓮.統(tǒng)計(jì)學(xué).第七章 相關(guān)與回歸分析.第一節(jié) 相關(guān)分析.西安石油大學(xué).經(jīng)濟(jì)管理學(xué)院
  • 使用案例參考了MBA智庫網(wǎng)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末松捉,一起剝皮案震驚了整個(gè)濱河市夹界,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌隘世,老刑警劉巖可柿,帶你破解...
    沈念sama閱讀 211,265評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異丙者,居然都是意外死亡复斥,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,078評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門械媒,熙熙樓的掌柜王于貴愁眉苦臉地迎上來目锭,“玉大人,你說我怎么就攤上這事滥沫。” “怎么了键俱?”我有些...
    開封第一講書人閱讀 156,852評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵兰绣,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我编振,道長(zhǎng)缀辩,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,408評(píng)論 1 283
  • 正文 為了忘掉前任踪央,我火速辦了婚禮臀玄,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘畅蹂。我一直安慰自己健无,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,445評(píng)論 5 384
  • 文/花漫 我一把揭開白布液斜。 她就那樣靜靜地躺著累贤,像睡著了一般叠穆。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上臼膏,一...
    開封第一講書人閱讀 49,772評(píng)論 1 290
  • 那天硼被,我揣著相機(jī)與錄音,去河邊找鬼渗磅。 笑死嚷硫,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的始鱼。 我是一名探鬼主播仔掸,決...
    沈念sama閱讀 38,921評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼风响!你這毒婦竟也來了嘉汰?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,688評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤状勤,失蹤者是張志新(化名)和其女友劉穎鞋怀,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體持搜,經(jīng)...
    沈念sama閱讀 44,130評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡密似,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,467評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了葫盼。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片残腌。...
    茶點(diǎn)故事閱讀 38,617評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖贫导,靈堂內(nèi)的尸體忽然破棺而出抛猫,到底是詐尸還是另有隱情,我是刑警寧澤孩灯,帶...
    沈念sama閱讀 34,276評(píng)論 4 329
  • 正文 年R本政府宣布闺金,位于F島的核電站,受9級(jí)特大地震影響峰档,放射性物質(zhì)發(fā)生泄漏败匹。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,882評(píng)論 3 312
  • 文/蒙蒙 一讥巡、第九天 我趴在偏房一處隱蔽的房頂上張望掀亩。 院中可真熱鬧,春花似錦欢顷、人聲如沸槽棍。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,740評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽刹泄。三九已至外里,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間特石,已是汗流浹背盅蝗。 一陣腳步聲響...
    開封第一講書人閱讀 31,967評(píng)論 1 265
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留姆蘸,地道東北人墩莫。 一個(gè)月前我還...
    沈念sama閱讀 46,315評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像逞敷,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子推捐,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,486評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容