007第三十三篇:雙變項(xiàng)“回歸分析”注重的是因果—統(tǒng)計(jì)學(xué)(10)

數(shù)據(jù)散點(diǎn)圖

背景知識(shí):

兩個(gè)變項(xiàng)之間的關(guān)系會(huì)有以下遞進(jìn)關(guān)系:

1、毫無(wú)關(guān)系:兩個(gè)變項(xiàng)你是你欺旧、我是我姑丑,一個(gè)陽(yáng)關(guān)道、一個(gè)獨(dú)木橋辞友。人們常說(shuō)“關(guān)你X事栅哀、關(guān)我X事”,也說(shuō)毫無(wú)相關(guān)性踏枣,當(dāng)然這里不涉及“蝴蝶效應(yīng)”那種絕對(duì)辯證唯物主義昌屉。

2、有相關(guān)性:分強(qiáng)弱茵瀑、正負(fù)间驮,上篇短文專(zhuān)門(mén)敘述http://www.reibang.com/p/ecfd913d69f6

3、回歸分析:是預(yù)設(shè)因果的相關(guān)分析马昨,兩個(gè)變項(xiàng)我們假設(shè)一個(gè)是自變項(xiàng)竞帽、另一個(gè)是因變項(xiàng)。人們都喜歡因果論鸿捧,事物終究因什么起屹篓、因什么落。了解清楚以前后匙奴,仿佛預(yù)測(cè)將來(lái)產(chǎn)生確定感堆巧,內(nèi)心便平靜許多。自變項(xiàng)為因泼菌、因變項(xiàng)為果谍肤。誰(shuí)是因誰(shuí)是果,可以由時(shí)間順序定哗伯、也可由邏輯順序定荒揣。前期只是假設(shè),之后有回歸分析確定兩變項(xiàng)是否前后呼應(yīng)焊刹、由此及彼系任】叶祝“顯著”與“不顯著”代替了“是”與“否”。

數(shù)據(jù)分析:

其實(shí)大白話就是猜測(cè)俩滥。開(kāi)始猜測(cè)嘉蕾,還是由簡(jiǎn)單到復(fù)雜吧。

1霜旧、第一種猜測(cè)法—單變項(xiàng)分析:假設(shè)只能得到一個(gè)屬性的大量數(shù)據(jù)荆针,比如說(shuō)“一個(gè)公司員工的年薪”,如前所述遵循正態(tài)分布颁糟。任意一個(gè)員工年薪是多少呢?不是瞎猜喉悴,看著正態(tài)分布圖猜測(cè)棱貌。當(dāng)然是猜平均值了,因?yàn)楦怕试谀抢锩髅靼装追胖啵骄狄粋€(gè)標(biāo)準(zhǔn)差的的范圍內(nèi)概率可是68.26%婚脱,比扔硬幣·的概率都高。具體參看:


正態(tài)分布

看看誤差很大的勺像,沒(méi)辦法我們只知道年薪一個(gè)屬性障贸,這樣就是最好了,也就是現(xiàn)有條件下吟宦,誤差最小就是最好了篮洁。

2、第二種猜測(cè)法—二元回歸分析(雙變項(xiàng)回歸分析):想要再精確一點(diǎn)殃姓,只有加入限制條件袁波,為年薪找個(gè)參照,即影響年薪的條件蜗侈,比如受教育程度篷牌。假定受教育程度是自變項(xiàng)、年薪是因變項(xiàng)踏幻。這樣我們就不必只看正態(tài)分布枷颊,應(yīng)用可憐的單一概率了。

直接舉例子:spss軟件该面,輸入年薪和教育年限數(shù)據(jù)后得到結(jié)果如下


教育與年薪回歸分析結(jié)果


誤差對(duì)比 :水平線—第一猜測(cè)夭苗、斜線—第二猜測(cè)

第一猜測(cè):是水平線,第二猜測(cè):是斜線吆倦,散點(diǎn)是各個(gè)實(shí)際數(shù)據(jù)听诸,從圖形直觀看每個(gè)點(diǎn)到線的距離,就是各點(diǎn)的誤差蚕泽。很明顯第二猜測(cè)比第一猜測(cè)靠譜多了晌梨。

少用公式這個(gè)不能少桥嗤,本例回歸方程(教育與年薪的關(guān)系):

y=a+bx+e——y=-18331+3909*EDUC+e

a:是斜線在x=0時(shí)y的值;

b:回歸系數(shù)分兩種仔蝌,1泛领、未標(biāo)準(zhǔn)化系數(shù) ? 利用原始數(shù)據(jù)測(cè)量單位的數(shù)值,表示當(dāng)自變項(xiàng)變化一個(gè)單位時(shí)敛惊,因變項(xiàng)發(fā)生的變化渊鞋。(1年教育使年薪變化3909元)2、標(biāo)準(zhǔn)化系數(shù) ??自變項(xiàng)變化一個(gè)標(biāo)準(zhǔn)差時(shí)瞧挤,因變項(xiàng)發(fā)生的變化標(biāo)準(zhǔn)差锡宋。另外:正負(fù)號(hào)代表正負(fù)相關(guān)。(本例中教育程度標(biāo)準(zhǔn)差2.885年特恬,年薪標(biāo)準(zhǔn)差17075.66元执俩,標(biāo)準(zhǔn)回歸系數(shù)0.661的意思是,教育程度變化2.885年癌刽,則年薪變化為17075.66*0.661=11287.88元)役首。

e:是一個(gè)提醒,告訴我們显拜,這個(gè)方程與現(xiàn)實(shí)還是存在誤差的衡奥。

3、最小二乘回歸就是把猜測(cè)誤差減小了远荠。

ordinary least squares regression 縮寫(xiě)OLS regression 直譯 普通最小平方和回歸矮固。

求出能把誤差平方和最小化的回歸系數(shù),具體求法先不考慮解釋矮台。了解最小二乘線性回歸分析乏屯,就是計(jì)算出一個(gè)回歸系數(shù),使用這個(gè)系數(shù)瘦赫,根據(jù)自變項(xiàng)的值猜測(cè)因變項(xiàng)的值辰晕,能最大程度減小根據(jù)平均值猜測(cè)所產(chǎn)生的誤差。

4确虱、判定系數(shù)R2含友,(標(biāo)準(zhǔn)回歸系數(shù)R)顯示預(yù)測(cè)準(zhǔn)確度提高了多少。

只是說(shuō)第一種猜測(cè)(正態(tài)分布的平均值)與第二種猜測(cè)(二元回歸方程)有差距校辩。第二種比第一種好窘问,好多少呢?

第一種猜測(cè)誤差是1379億宜咒,第二種猜測(cè)減少了602億惠赫,占原有誤差的43.6%,也就是R2=0.436(R=0.661)故黑。意味著猜測(cè)準(zhǔn)確度提高了43.6%儿咱。

總結(jié):二元回歸分析(加一個(gè)限制條件庭砍,預(yù)設(shè)因果關(guān)系),提高了僅用平均值猜測(cè)的準(zhǔn)確度混埠。文中沒(méi)有提及計(jì)算方法怠缸,所有計(jì)算用spss軟件代替,我們了解原理钳宪,直接用結(jié)果就好揭北。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市吏颖,隨后出現(xiàn)的幾起案子搔体,更是在濱河造成了極大的恐慌,老刑警劉巖半醉,帶你破解...
    沈念sama閱讀 222,729評(píng)論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件嫉柴,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡奉呛,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,226評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén)夯尽,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)瞧壮,“玉大人,你說(shuō)我怎么就攤上這事匙握∨夭郏” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 169,461評(píng)論 0 362
  • 文/不壞的土叔 我叫張陵圈纺,是天一觀的道長(zhǎng)秦忿。 經(jīng)常有香客問(wèn)我,道長(zhǎng)蛾娶,這世上最難降的妖魔是什么灯谣? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 60,135評(píng)論 1 300
  • 正文 為了忘掉前任,我火速辦了婚禮蛔琅,結(jié)果婚禮上胎许,老公的妹妹穿的比我還像新娘。我一直安慰自己罗售,他們只是感情好辜窑,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,130評(píng)論 6 398
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著寨躁,像睡著了一般穆碎。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上职恳,一...
    開(kāi)封第一講書(shū)人閱讀 52,736評(píng)論 1 312
  • 那天所禀,我揣著相機(jī)與錄音方面,去河邊找鬼。 笑死北秽,一個(gè)胖子當(dāng)著我的面吹牛葡幸,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播贺氓,決...
    沈念sama閱讀 41,179評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼蔚叨,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了辙培?” 一聲冷哼從身側(cè)響起蔑水,我...
    開(kāi)封第一講書(shū)人閱讀 40,124評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎扬蕊,沒(méi)想到半個(gè)月后搀别,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,657評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡尾抑,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,723評(píng)論 3 342
  • 正文 我和宋清朗相戀三年歇父,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片再愈。...
    茶點(diǎn)故事閱讀 40,872評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡榜苫,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出翎冲,到底是詐尸還是另有隱情垂睬,我是刑警寧澤,帶...
    沈念sama閱讀 36,533評(píng)論 5 351
  • 正文 年R本政府宣布抗悍,位于F島的核電站驹饺,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏缴渊。R本人自食惡果不足惜赏壹,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,213評(píng)論 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望衔沼。 院中可真熱鬧卡儒,春花似錦、人聲如沸俐巴。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,700評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)欣舵。三九已至擎鸠,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間缘圈,已是汗流浹背劣光。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,819評(píng)論 1 274
  • 我被黑心中介騙來(lái)泰國(guó)打工袜蚕, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人绢涡。 一個(gè)月前我還...
    沈念sama閱讀 49,304評(píng)論 3 379
  • 正文 我出身青樓牲剃,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親雄可。 傳聞我的和親對(duì)象是個(gè)殘疾皇子凿傅,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,876評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容