OLS回歸案例分析

一泻骤、案例背景

研究高管信息以及企業(yè)規(guī)模資產(chǎn)對于研發(fā)投入的影響围肥,其中高管信息包括罩扇,高管研究平均年齡婆芦、高管平均任期(天)怕磨、高管平均學(xué)歷以及高管團(tuán)隊(duì)人數(shù)喂饥,具體的名詞解釋請參考下方表格,此案例主要利用SPSSAU回歸分析高管信息以及企業(yè)規(guī)模資產(chǎn)對于研發(fā)投入的影響肠鲫。并對結(jié)果進(jìn)行解釋员帮,首先將搜集的數(shù)據(jù)進(jìn)行處理导饲。

二氯材、數(shù)據(jù)處理

1.減少異方差

將數(shù)據(jù)進(jìn)行對數(shù)處理氢哮,目的是將單位進(jìn)行壓縮型檀,以減少在某些情況下,數(shù)據(jù)的整個(gè)值域中的在不同區(qū)間的差異帶來的影響不同(特別注意:對數(shù)處理的數(shù)據(jù)應(yīng)該大于0胀溺,如果小于等于0需要在excel中處理)

2.異常值檢查

在數(shù)據(jù)分析之前仓坞,首先需要進(jìn)行數(shù)據(jù)查看背零,案例是問卷數(shù)據(jù)所以對于數(shù)據(jù)進(jìn)行查看是否有異常值,常見的方法包括利用SPSSAU描述分析看數(shù)據(jù)是否正常无埃,散點(diǎn)圖以及箱線圖徙瓶。異常值的判斷標(biāo)準(zhǔn)如下:

檢驗(yàn)數(shù)據(jù)是否有異常值的方法:

異常值處理方法:

此案例對于異常值檢查使用散點(diǎn)圖:

分析結(jié)果來源于SPSSAU

由散點(diǎn)圖可以看出橫坐標(biāo)代表企業(yè)規(guī)模資產(chǎn),縱坐標(biāo)代表研發(fā)投入录语,可以看出異常值是14.610倍啥,所以將數(shù)據(jù)進(jìn)行篩選處理,處理如下:

處理后進(jìn)行再次檢查澎埠,可使用SPSSAU可視化的箱線圖虽缕。

三、基本關(guān)系查看

數(shù)據(jù)處理后蒲稳,我們切入正題氮趋,回歸分析前需要進(jìn)行基本關(guān)系查看,其中包括因變量與自變量的線性關(guān)系江耀、相關(guān)關(guān)系以及因變量的正態(tài)性剩胁,接下來一一說明。

1.線性關(guān)系

做數(shù)據(jù)的散點(diǎn)圖(由于數(shù)據(jù)過多祥国,所以分析時(shí)利用SPSSAU提供的Bins處理昵观,Bins=25),觀察因變量與自變量之間是否具有線性特點(diǎn)舌稀。

分析結(jié)果來源SPSSAU

從上圖中可以看出啊犬,研發(fā)投入和高管平均年齡、高管平均任期壁查、高管平均學(xué)歷觉至、高管團(tuán)隊(duì)人數(shù)以及企業(yè)規(guī)模資產(chǎn)存在線性關(guān)系,其中Y軸為因變量研發(fā)投入睡腿。X軸為自變量语御。

2.相關(guān)關(guān)系

相關(guān)分析是研究有沒有關(guān)系,回歸分析是研究影響關(guān)系纤控。明顯地,相關(guān)分析是基礎(chǔ)惜辑,然后再進(jìn)行回歸分析碎节。首先需要知道有沒有相關(guān)關(guān)系狮荔;有了相關(guān)關(guān)系殖氏,才可能有回歸影響關(guān)系雅采;如果沒有相關(guān)關(guān)系婚瓜,是不應(yīng)該有回歸影響關(guān)系的巴刻。

從上圖可以看出胡陪,研發(fā)投入(元)與高管平均年齡, 高管平均任期(天), 高管平均學(xué)歷, 高管團(tuán)隊(duì)人數(shù), 企業(yè)規(guī)模資產(chǎn)(元)共5項(xiàng)之間的相關(guān)關(guān)系系數(shù)值呈現(xiàn)出顯著性柠座,具體來看愚隧,研發(fā)投入(元)和高管平均年齡之間的相關(guān)系數(shù)值為-0.189狂塘,并且呈現(xiàn)出0.01水平的顯著性荞胡,因而說明研發(fā)投入(元)和高管平均年齡之間有著顯著的負(fù)相關(guān)關(guān)系泪漂。研發(fā)投入(元)和高管平均任期(天)之間的相關(guān)系數(shù)值為0.099萝勤,并且呈現(xiàn)出0.05水平的顯著性敌卓,因而說明研發(fā)投入(元)和高管平均任期(天)之間有著顯著的正相關(guān)關(guān)系趟径。研發(fā)投入(元)和高管平均學(xué)歷之間的相關(guān)系數(shù)值為0.266,并且呈現(xiàn)出0.01水平的顯著性蕾盯,因而說明研發(fā)投入(元)和高管平均學(xué)歷之間有著顯著的正相關(guān)關(guān)系香嗓。研發(fā)投入(元)和高管團(tuán)隊(duì)人數(shù)之間的相關(guān)系數(shù)值為0.236靠娱,并且呈現(xiàn)出0.01水平的顯著性像云,因而說明研發(fā)投入(元)和高管團(tuán)隊(duì)人數(shù)之間有著顯著的正相關(guān)關(guān)系迅诬。研發(fā)投入(元)和企業(yè)規(guī)模資產(chǎn)(元)之間的相關(guān)系數(shù)值為0.619侈贷,并且呈現(xiàn)出0.01水平的顯著性俏蛮,因而說明研發(fā)投入(元)和企業(yè)規(guī)模資產(chǎn)(元)之間有著顯著的正相關(guān)關(guān)系争涌。

3.正態(tài)性

f分析結(jié)果來源于SPSSAU

橫軸各坐標(biāo)為各分組的起止范圍亮垫;左邊Y軸代表的是正態(tài)曲線的概率密度饮潦;右側(cè)Y軸代表頻率害晦。從圖中可以看出因變量研發(fā)投入呈正態(tài)分布壹瘟。對于正態(tài)檢驗(yàn)SPSSAU還提供了其它方法稻轨,比如P-P/Q-Q圖殴俱、正態(tài)檢驗(yàn)等线欲。具體請參考

直方圖、正態(tài)圖趴泌,如何解讀才正確嗜憔?

四吉捶、回歸結(jié)果

通過基本關(guān)系查看可以發(fā)現(xiàn)因變量和自變量之間具有線性關(guān)系币励,以及對于相關(guān)關(guān)系也有說明,處理后的因變量符合正態(tài)性杆麸,對年份進(jìn)行啞變量處理昔头,特別說明啞變量處理后在分析時(shí)要少放一項(xiàng)作為參照項(xiàng),模型效果從F檢驗(yàn)峻堰、擬合優(yōu)度旦万、多重共線性以及異方差檢驗(yàn)四個(gè)方面進(jìn)行說明成艘。

1.模型效果

(1)F檢驗(yàn)

從上表可以看出,離差平方和為293.242秋冰,殘差平方和為156.720丹莲,而回歸平方和為136.522≈拚裕回歸方程的顯著性檢驗(yàn)中芝发,統(tǒng)計(jì)量F=49.903,對應(yīng)的p值遠(yuǎn)遠(yuǎn)小于0.05独悴,被解釋變量的線性關(guān)系是顯著的,可以建立模型坟奥。建立模型后,需要查看模型擬合優(yōu)度是否可以管行,其中就可以查看R方與調(diào)整R方值。

(2)擬合優(yōu)度

從上表可知迅涮,將高管平均年齡叮姑、高管平均任期传透、高管平均學(xué)歷、高管團(tuán)隊(duì)人數(shù)以及企業(yè)規(guī)模資產(chǎn)作為自變量极颓,而將研發(fā)投入作為因變量進(jìn)行線性回歸分析朱盐,從上表可以看出,模型R方值為0.466菠隆,調(diào)整R方為0.456兵琳,其中R方是決定系數(shù)狂秘,模型擬合指標(biāo)。反應(yīng)Y的波動(dòng)有多少比例能被X的波動(dòng)描述躯肌。調(diào)整R方也是模型擬合指標(biāo)者春。當(dāng)x個(gè)數(shù)較多是調(diào)整R2比R2更為準(zhǔn)確钱烟。意味著社會(huì)資源, 教育水平, 科技發(fā)展可以解釋創(chuàng)業(yè)可能性的46.6%變化原因稻扬〕韭穑可見擒贸,模型擬合優(yōu)度良好,說明被解釋變量可以被模型解釋的部分較少。接下來查看變量是否具有多重共線性。

補(bǔ)充說明:

R平方值表示模型擬合能力的大小,比如0.3表示自變量X對于因變量Y有30%的解釋能力。這個(gè)值介于0~1之間铡买,越大越好景埃。但實(shí)際研究中并沒有固定的標(biāo)準(zhǔn),有的專業(yè)0.1甚至0.05這樣都可以屈尼,但有的專業(yè)卻常常出現(xiàn)0.8以上。一般情況下只需要報(bào)告此值即可,不用過多關(guān)注其大小旁蔼,原因在于多數(shù)時(shí)候我們更在乎X對于Y是否有影響關(guān)系即可葵诈。

(3)多重共線性

分析結(jié)果來源于SPSSAU

VIF值用于檢測共線性問題,一般VIF值小于10即說明沒有共線性(嚴(yán)格的標(biāo)準(zhǔn)是5)贰锁,有時(shí)候會(huì)以容差值作為標(biāo)準(zhǔn),容差值=1/VIF粤攒,所以容差值大于0.1則說明沒有共線性(嚴(yán)格是大于0.2)晴弃,VIF和容差值有邏輯對應(yīng)關(guān)系,因此二選一即可,一般描述VIF值谴咸。在【線性回歸】分析時(shí),SPSSAU會(huì)智能判斷共線性問題并且提供解決建議。 結(jié)果中可以看出京办,變量的VIF值均小于5柄瑰,所以此案例不存在多重共線性的問題缕探。

但是如果存在多重共線問題,建議三種解決方法一是使用逐步回歸分析(讓模型自動(dòng)剔除掉共線性過高項(xiàng));二是使用嶺回歸分析(使用數(shù)學(xué)方法解決共線性問題)炫狱,三是進(jìn)行相關(guān)分析椅亚,手工移出相關(guān)性非常高的分析項(xiàng)(通過主觀分析解決),然后再做線性回歸分析描验。

多重共線性問題,如何解決鲁沥?

(4)異方差檢驗(yàn)

在計(jì)量研究中呼股,異方差問題非常重要,嚴(yán)重的異方差問題會(huì)影響模型估計(jì)和模型檢驗(yàn)等画恰,因而在OLS回歸時(shí)需要對其進(jìn)行檢驗(yàn)彭谁,如果出現(xiàn)異方差問題則需要進(jìn)行處理等。將殘差與自變量進(jìn)行相關(guān)分析允扇,觀察殘差與自變量是否有相關(guān)關(guān)系缠局。

從上表可知则奥,針對異方差情況,使用懷特(White)檢驗(yàn)和BP檢驗(yàn)兩種方法進(jìn)行檢驗(yàn)狭园。檢驗(yàn)原假設(shè)為模型沒有異方差读处,上表顯示兩種檢驗(yàn)均拒絕原假設(shè)(p<0.05),說明模型存在異方差唱矛,建議可使用Robust穩(wěn)健標(biāo)準(zhǔn)誤回歸方法進(jìn)行研究罚舱,以解決異方差問題。返回分析頁面進(jìn)行勾選Robust穩(wěn)健標(biāo)準(zhǔn)誤即可绎谦。

2.模型結(jié)果

回歸的中間過程包括F檢驗(yàn)管闷、擬合優(yōu)度、多重共線性以及異方差檢驗(yàn)窃肠,這些都是在分析前需要進(jìn)行觀測與分析的渐北,接下來將從分析結(jié)果以及穩(wěn)健性檢驗(yàn)進(jìn)行對模型結(jié)果的闡述。

(1)分析結(jié)果

上表可知铭拧,將高管平均年齡, 高管平均任期(天), 高管平均學(xué)歷, 高管團(tuán)隊(duì)人數(shù), 企業(yè)規(guī)模資產(chǎn)(元)作為自變量進(jìn)行OLS回歸分析赃蛛,并且使用Robust穩(wěn)健標(biāo)準(zhǔn)誤回歸方法進(jìn)行研究,從上表可以看出搀菩,模型R方值為0.463呕臂,意味著高管平均年齡, 高管平均任期(天), 高管平均學(xué)歷, 高管團(tuán)隊(duì)人數(shù), 企業(yè)規(guī)模資產(chǎn)(元)可以解釋研發(fā)投入(元)的46.31%變化原因。對模型進(jìn)行F檢驗(yàn)時(shí)發(fā)現(xiàn)模型通過F檢驗(yàn)(F=67.196肪跋,p=0.000<0.05)歧蒋,也即說明高管平均年齡, 高管平均任期(天), 高管平均學(xué)歷, 高管團(tuán)隊(duì)人數(shù), 企業(yè)規(guī)模資產(chǎn)(元)至少一項(xiàng)會(huì)對研發(fā)投入(元)產(chǎn)生影響關(guān)系,以及模型公式為:研發(fā)投入(元)=1.644-1.315*高管平均年齡 + 0.004*高管平均任期(天) + 1.185*高管平均學(xué)歷 + 0.339*高管團(tuán)隊(duì)人數(shù) + 0.878*企業(yè)規(guī)模資產(chǎn)(元)州既∶涨ⅲ總結(jié)分析可知:高管平均學(xué)歷, 高管團(tuán)隊(duì)人數(shù), 企業(yè)規(guī)模資產(chǎn)(元)會(huì)對研發(fā)投入(元)產(chǎn)生顯著的正向影響關(guān)系。以及高管平均年齡會(huì)對研發(fā)投入(元)產(chǎn)生顯著的負(fù)向影響關(guān)系吴叶。但是高管平均任期(天)并不會(huì)對研發(fā)投入(元)產(chǎn)生影響關(guān)系阐虚。

(2)穩(wěn)健性檢驗(yàn)

穩(wěn)健性檢驗(yàn)是指模型的穩(wěn)定性,使用多種形式時(shí)模型均穩(wěn)定,應(yīng)該顯著的項(xiàng)還是顯著,不顯著的依舊不顯著。一般情況下建議在線性回歸時(shí)考慮加入控制變量,和不加入控制變量兩種情況下對比模型的穩(wěn)定性,當(dāng)然也可以使用多種研究方法比如線性回歸,逐步回歸,分層回歸等,多種方法測試同一個(gè)變量的顯著性情況是否有著變化,如果無論如何均穩(wěn)定或者極個(gè)別在變化,均說明模型具有穩(wěn)健性蚌卤。方法說明如下:

本次分析選擇第一個(gè)分析方法实束,對于放置控制變量與不放置控制變量進(jìn)行分析對比(本案例中控制變量為年份):

分析結(jié)果來源于SPSSAU

高管平均學(xué)歷, 高管團(tuán)隊(duì)人數(shù), 企業(yè)規(guī)模資產(chǎn)(元)會(huì)對研發(fā)投入(元)產(chǎn)生顯著的正向影響關(guān)系。以及高管平均年齡會(huì)對研發(fā)投入(元)產(chǎn)生顯著的負(fù)向影響關(guān)系逊彭。但是高管平均任期(天)并不會(huì)對研發(fā)投入(元)產(chǎn)生影響關(guān)系咸灿。總結(jié)可知侮叮,前后對比發(fā)現(xiàn)自變量顯著性未發(fā)生改變模型具有穩(wěn)健性避矢。

五、總結(jié)

利用SPSSAU回歸分析高管信息以及企業(yè)規(guī)模資產(chǎn)對于研發(fā)投入的影響。首先對數(shù)據(jù)進(jìn)行處理包括數(shù)據(jù)取對數(shù)以及異常值檢查审胸。緊接著對于分析的基本關(guān)系進(jìn)行查看分尸,包括線性關(guān)系,相關(guān)關(guān)系以及正態(tài)性歹嘹,對處理后的數(shù)據(jù)進(jìn)行分析箩绍,從兩個(gè)方面進(jìn)行闡述,包括模型效果以及模型結(jié)果尺上,模型效果從F檢驗(yàn)材蛛、擬合優(yōu)度、多重共線性以及異方差檢驗(yàn)四個(gè)方面進(jìn)行說明怎抛。發(fā)現(xiàn)模型具有異方差性卑吭,使用Robust穩(wěn)健標(biāo)準(zhǔn)誤回歸方法進(jìn)行研究。得到的結(jié)論是:高管平均學(xué)歷, 高管團(tuán)隊(duì)人數(shù), 企業(yè)規(guī)模資產(chǎn)(元)會(huì)對研發(fā)投入(元)產(chǎn)生顯著的正向影響關(guān)系马绝。以及高管平均年齡會(huì)對研發(fā)投入(元)產(chǎn)生顯著的負(fù)向影響關(guān)系豆赏。對分析后的模型進(jìn)行穩(wěn)健性檢驗(yàn)發(fā)現(xiàn)模型具有穩(wěn)健性,分析結(jié)束富稻。


更多干貨請登錄SPSSAU官方網(wǎng)站查看掷邦。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市椭赋,隨后出現(xiàn)的幾起案子抚岗,更是在濱河造成了極大的恐慌,老刑警劉巖哪怔,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件宣蔚,死亡現(xiàn)場離奇詭異,居然都是意外死亡认境,警方通過查閱死者的電腦和手機(jī)胚委,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來叉信,“玉大人亩冬,你說我怎么就攤上這事≤哉担” “怎么了鉴未?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長鸠姨。 經(jīng)常有香客問我,道長淹真,這世上最難降的妖魔是什么讶迁? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮核蘸,結(jié)果婚禮上巍糯,老公的妹妹穿的比我還像新娘啸驯。我一直安慰自己,他們只是感情好祟峦,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布罚斗。 她就那樣靜靜地躺著,像睡著了一般宅楞。 火紅的嫁衣襯著肌膚如雪针姿。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天厌衙,我揣著相機(jī)與錄音距淫,去河邊找鬼。 笑死婶希,一個(gè)胖子當(dāng)著我的面吹牛榕暇,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播喻杈,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼彤枢,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了筒饰?” 一聲冷哼從身側(cè)響起堂污,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎龄砰,沒想到半個(gè)月后盟猖,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡换棚,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年式镐,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片固蚤。...
    茶點(diǎn)故事閱讀 39,977評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡娘汞,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出夕玩,到底是詐尸還是另有隱情你弦,我是刑警寧澤,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布燎孟,位于F島的核電站禽作,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏揩页。R本人自食惡果不足惜旷偿,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧萍程,春花似錦幢妄、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至忍法,卻和暖如春潮尝,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背缔赠。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工衍锚, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人嗤堰。 一個(gè)月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓戴质,卻偏偏與公主長得像,于是被迫代替她去往敵國和親踢匣。 傳聞我的和親對象是個(gè)殘疾皇子告匠,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內(nèi)容