一泻骤、案例背景
研究高管信息以及企業(yè)規(guī)模資產(chǎn)對于研發(fā)投入的影響围肥,其中高管信息包括罩扇,高管研究平均年齡婆芦、高管平均任期(天)怕磨、高管平均學(xué)歷以及高管團(tuán)隊(duì)人數(shù)喂饥,具體的名詞解釋請參考下方表格,此案例主要利用SPSSAU回歸分析高管信息以及企業(yè)規(guī)模資產(chǎn)對于研發(fā)投入的影響肠鲫。并對結(jié)果進(jìn)行解釋员帮,首先將搜集的數(shù)據(jù)進(jìn)行處理导饲。
二氯材、數(shù)據(jù)處理
1.減少異方差
將數(shù)據(jù)進(jìn)行對數(shù)處理氢哮,目的是將單位進(jìn)行壓縮型檀,以減少在某些情況下,數(shù)據(jù)的整個(gè)值域中的在不同區(qū)間的差異帶來的影響不同(特別注意:對數(shù)處理的數(shù)據(jù)應(yīng)該大于0胀溺,如果小于等于0需要在excel中處理)
2.異常值檢查
在數(shù)據(jù)分析之前仓坞,首先需要進(jìn)行數(shù)據(jù)查看背零,案例是問卷數(shù)據(jù)所以對于數(shù)據(jù)進(jìn)行查看是否有異常值,常見的方法包括利用SPSSAU描述分析看數(shù)據(jù)是否正常无埃,散點(diǎn)圖以及箱線圖徙瓶。異常值的判斷標(biāo)準(zhǔn)如下:
檢驗(yàn)數(shù)據(jù)是否有異常值的方法:
異常值處理方法:
此案例對于異常值檢查使用散點(diǎn)圖:
由散點(diǎn)圖可以看出橫坐標(biāo)代表企業(yè)規(guī)模資產(chǎn),縱坐標(biāo)代表研發(fā)投入录语,可以看出異常值是14.610倍啥,所以將數(shù)據(jù)進(jìn)行篩選處理,處理如下:
處理后進(jìn)行再次檢查澎埠,可使用SPSSAU可視化的箱線圖虽缕。
三、基本關(guān)系查看
數(shù)據(jù)處理后蒲稳,我們切入正題氮趋,回歸分析前需要進(jìn)行基本關(guān)系查看,其中包括因變量與自變量的線性關(guān)系江耀、相關(guān)關(guān)系以及因變量的正態(tài)性剩胁,接下來一一說明。
1.線性關(guān)系
做數(shù)據(jù)的散點(diǎn)圖(由于數(shù)據(jù)過多祥国,所以分析時(shí)利用SPSSAU提供的Bins處理昵观,Bins=25),觀察因變量與自變量之間是否具有線性特點(diǎn)舌稀。
從上圖中可以看出啊犬,研發(fā)投入和高管平均年齡、高管平均任期壁查、高管平均學(xué)歷觉至、高管團(tuán)隊(duì)人數(shù)以及企業(yè)規(guī)模資產(chǎn)存在線性關(guān)系,其中Y軸為因變量研發(fā)投入睡腿。X軸為自變量语御。
2.相關(guān)關(guān)系
相關(guān)分析是研究有沒有關(guān)系,回歸分析是研究影響關(guān)系纤控。明顯地,相關(guān)分析是基礎(chǔ)惜辑,然后再進(jìn)行回歸分析碎节。首先需要知道有沒有相關(guān)關(guān)系狮荔;有了相關(guān)關(guān)系殖氏,才可能有回歸影響關(guān)系雅采;如果沒有相關(guān)關(guān)系婚瓜,是不應(yīng)該有回歸影響關(guān)系的巴刻。
從上圖可以看出胡陪,研發(fā)投入(元)與高管平均年齡, 高管平均任期(天), 高管平均學(xué)歷, 高管團(tuán)隊(duì)人數(shù), 企業(yè)規(guī)模資產(chǎn)(元)共5項(xiàng)之間的相關(guān)關(guān)系系數(shù)值呈現(xiàn)出顯著性柠座,具體來看愚隧,研發(fā)投入(元)和高管平均年齡之間的相關(guān)系數(shù)值為-0.189狂塘,并且呈現(xiàn)出0.01水平的顯著性荞胡,因而說明研發(fā)投入(元)和高管平均年齡之間有著顯著的負(fù)相關(guān)關(guān)系泪漂。研發(fā)投入(元)和高管平均任期(天)之間的相關(guān)系數(shù)值為0.099萝勤,并且呈現(xiàn)出0.05水平的顯著性敌卓,因而說明研發(fā)投入(元)和高管平均任期(天)之間有著顯著的正相關(guān)關(guān)系趟径。研發(fā)投入(元)和高管平均學(xué)歷之間的相關(guān)系數(shù)值為0.266,并且呈現(xiàn)出0.01水平的顯著性蕾盯,因而說明研發(fā)投入(元)和高管平均學(xué)歷之間有著顯著的正相關(guān)關(guān)系香嗓。研發(fā)投入(元)和高管團(tuán)隊(duì)人數(shù)之間的相關(guān)系數(shù)值為0.236靠娱,并且呈現(xiàn)出0.01水平的顯著性像云,因而說明研發(fā)投入(元)和高管團(tuán)隊(duì)人數(shù)之間有著顯著的正相關(guān)關(guān)系迅诬。研發(fā)投入(元)和企業(yè)規(guī)模資產(chǎn)(元)之間的相關(guān)系數(shù)值為0.619侈贷,并且呈現(xiàn)出0.01水平的顯著性俏蛮,因而說明研發(fā)投入(元)和企業(yè)規(guī)模資產(chǎn)(元)之間有著顯著的正相關(guān)關(guān)系争涌。
3.正態(tài)性
橫軸各坐標(biāo)為各分組的起止范圍亮垫;左邊Y軸代表的是正態(tài)曲線的概率密度饮潦;右側(cè)Y軸代表頻率害晦。從圖中可以看出因變量研發(fā)投入呈正態(tài)分布壹瘟。對于正態(tài)檢驗(yàn)SPSSAU還提供了其它方法稻轨,比如P-P/Q-Q圖殴俱、正態(tài)檢驗(yàn)等线欲。具體請參考
四吉捶、回歸結(jié)果
通過基本關(guān)系查看可以發(fā)現(xiàn)因變量和自變量之間具有線性關(guān)系币励,以及對于相關(guān)關(guān)系也有說明,處理后的因變量符合正態(tài)性杆麸,對年份進(jìn)行啞變量處理昔头,特別說明啞變量處理后在分析時(shí)要少放一項(xiàng)作為參照項(xiàng),模型效果從F檢驗(yàn)峻堰、擬合優(yōu)度旦万、多重共線性以及異方差檢驗(yàn)四個(gè)方面進(jìn)行說明成艘。
1.模型效果
(1)F檢驗(yàn)
從上表可以看出,離差平方和為293.242秋冰,殘差平方和為156.720丹莲,而回歸平方和為136.522≈拚裕回歸方程的顯著性檢驗(yàn)中芝发,統(tǒng)計(jì)量F=49.903,對應(yīng)的p值遠(yuǎn)遠(yuǎn)小于0.05独悴,被解釋變量的線性關(guān)系是顯著的,可以建立模型坟奥。建立模型后,需要查看模型擬合優(yōu)度是否可以管行,其中就可以查看R方與調(diào)整R方值。
(2)擬合優(yōu)度
從上表可知迅涮,將高管平均年齡叮姑、高管平均任期传透、高管平均學(xué)歷、高管團(tuán)隊(duì)人數(shù)以及企業(yè)規(guī)模資產(chǎn)作為自變量极颓,而將研發(fā)投入作為因變量進(jìn)行線性回歸分析朱盐,從上表可以看出,模型R方值為0.466菠隆,調(diào)整R方為0.456兵琳,其中R方是決定系數(shù)狂秘,模型擬合指標(biāo)。反應(yīng)Y的波動(dòng)有多少比例能被X的波動(dòng)描述躯肌。調(diào)整R方也是模型擬合指標(biāo)者春。當(dāng)x個(gè)數(shù)較多是調(diào)整R2比R2更為準(zhǔn)確钱烟。意味著社會(huì)資源, 教育水平, 科技發(fā)展可以解釋創(chuàng)業(yè)可能性的46.6%變化原因稻扬〕韭穑可見擒贸,模型擬合優(yōu)度良好,說明被解釋變量可以被模型解釋的部分較少。接下來查看變量是否具有多重共線性。
補(bǔ)充說明:
R平方值表示模型擬合能力的大小,比如0.3表示自變量X對于因變量Y有30%的解釋能力。這個(gè)值介于0~1之間铡买,越大越好景埃。但實(shí)際研究中并沒有固定的標(biāo)準(zhǔn),有的專業(yè)0.1甚至0.05這樣都可以屈尼,但有的專業(yè)卻常常出現(xiàn)0.8以上。一般情況下只需要報(bào)告此值即可,不用過多關(guān)注其大小旁蔼,原因在于多數(shù)時(shí)候我們更在乎X對于Y是否有影響關(guān)系即可葵诈。
(3)多重共線性
VIF值用于檢測共線性問題,一般VIF值小于10即說明沒有共線性(嚴(yán)格的標(biāo)準(zhǔn)是5)贰锁,有時(shí)候會(huì)以容差值作為標(biāo)準(zhǔn),容差值=1/VIF粤攒,所以容差值大于0.1則說明沒有共線性(嚴(yán)格是大于0.2)晴弃,VIF和容差值有邏輯對應(yīng)關(guān)系,因此二選一即可,一般描述VIF值谴咸。在【線性回歸】分析時(shí),SPSSAU會(huì)智能判斷共線性問題并且提供解決建議。 結(jié)果中可以看出京办,變量的VIF值均小于5柄瑰,所以此案例不存在多重共線性的問題缕探。
但是如果存在多重共線問題,建議三種解決方法一是使用逐步回歸分析(讓模型自動(dòng)剔除掉共線性過高項(xiàng));二是使用嶺回歸分析(使用數(shù)學(xué)方法解決共線性問題)炫狱,三是進(jìn)行相關(guān)分析椅亚,手工移出相關(guān)性非常高的分析項(xiàng)(通過主觀分析解決),然后再做線性回歸分析描验。
(4)異方差檢驗(yàn)
在計(jì)量研究中呼股,異方差問題非常重要,嚴(yán)重的異方差問題會(huì)影響模型估計(jì)和模型檢驗(yàn)等画恰,因而在OLS回歸時(shí)需要對其進(jìn)行檢驗(yàn)彭谁,如果出現(xiàn)異方差問題則需要進(jìn)行處理等。將殘差與自變量進(jìn)行相關(guān)分析允扇,觀察殘差與自變量是否有相關(guān)關(guān)系缠局。
從上表可知则奥,針對異方差情況,使用懷特(White)檢驗(yàn)和BP檢驗(yàn)兩種方法進(jìn)行檢驗(yàn)狭园。檢驗(yàn)原假設(shè)為模型沒有異方差读处,上表顯示兩種檢驗(yàn)均拒絕原假設(shè)(p<0.05),說明模型存在異方差唱矛,建議可使用Robust穩(wěn)健標(biāo)準(zhǔn)誤回歸方法進(jìn)行研究罚舱,以解決異方差問題。返回分析頁面進(jìn)行勾選Robust穩(wěn)健標(biāo)準(zhǔn)誤即可绎谦。
2.模型結(jié)果
回歸的中間過程包括F檢驗(yàn)管闷、擬合優(yōu)度、多重共線性以及異方差檢驗(yàn)窃肠,這些都是在分析前需要進(jìn)行觀測與分析的渐北,接下來將從分析結(jié)果以及穩(wěn)健性檢驗(yàn)進(jìn)行對模型結(jié)果的闡述。
(1)分析結(jié)果
上表可知铭拧,將高管平均年齡, 高管平均任期(天), 高管平均學(xué)歷, 高管團(tuán)隊(duì)人數(shù), 企業(yè)規(guī)模資產(chǎn)(元)作為自變量進(jìn)行OLS回歸分析赃蛛,并且使用Robust穩(wěn)健標(biāo)準(zhǔn)誤回歸方法進(jìn)行研究,從上表可以看出搀菩,模型R方值為0.463呕臂,意味著高管平均年齡, 高管平均任期(天), 高管平均學(xué)歷, 高管團(tuán)隊(duì)人數(shù), 企業(yè)規(guī)模資產(chǎn)(元)可以解釋研發(fā)投入(元)的46.31%變化原因。對模型進(jìn)行F檢驗(yàn)時(shí)發(fā)現(xiàn)模型通過F檢驗(yàn)(F=67.196肪跋,p=0.000<0.05)歧蒋,也即說明高管平均年齡, 高管平均任期(天), 高管平均學(xué)歷, 高管團(tuán)隊(duì)人數(shù), 企業(yè)規(guī)模資產(chǎn)(元)至少一項(xiàng)會(huì)對研發(fā)投入(元)產(chǎn)生影響關(guān)系,以及模型公式為:研發(fā)投入(元)=1.644-1.315*高管平均年齡 + 0.004*高管平均任期(天) + 1.185*高管平均學(xué)歷 + 0.339*高管團(tuán)隊(duì)人數(shù) + 0.878*企業(yè)規(guī)模資產(chǎn)(元)州既∶涨ⅲ總結(jié)分析可知:高管平均學(xué)歷, 高管團(tuán)隊(duì)人數(shù), 企業(yè)規(guī)模資產(chǎn)(元)會(huì)對研發(fā)投入(元)產(chǎn)生顯著的正向影響關(guān)系。以及高管平均年齡會(huì)對研發(fā)投入(元)產(chǎn)生顯著的負(fù)向影響關(guān)系吴叶。但是高管平均任期(天)并不會(huì)對研發(fā)投入(元)產(chǎn)生影響關(guān)系阐虚。
(2)穩(wěn)健性檢驗(yàn)
穩(wěn)健性檢驗(yàn)是指模型的穩(wěn)定性,使用多種形式時(shí)模型均穩(wěn)定,應(yīng)該顯著的項(xiàng)還是顯著,不顯著的依舊不顯著。一般情況下建議在線性回歸時(shí)考慮加入控制變量,和不加入控制變量兩種情況下對比模型的穩(wěn)定性,當(dāng)然也可以使用多種研究方法比如線性回歸,逐步回歸,分層回歸等,多種方法測試同一個(gè)變量的顯著性情況是否有著變化,如果無論如何均穩(wěn)定或者極個(gè)別在變化,均說明模型具有穩(wěn)健性蚌卤。方法說明如下:
本次分析選擇第一個(gè)分析方法实束,對于放置控制變量與不放置控制變量進(jìn)行分析對比(本案例中控制變量為年份):
高管平均學(xué)歷, 高管團(tuán)隊(duì)人數(shù), 企業(yè)規(guī)模資產(chǎn)(元)會(huì)對研發(fā)投入(元)產(chǎn)生顯著的正向影響關(guān)系。以及高管平均年齡會(huì)對研發(fā)投入(元)產(chǎn)生顯著的負(fù)向影響關(guān)系逊彭。但是高管平均任期(天)并不會(huì)對研發(fā)投入(元)產(chǎn)生影響關(guān)系咸灿。總結(jié)可知侮叮,前后對比發(fā)現(xiàn)自變量顯著性未發(fā)生改變模型具有穩(wěn)健性避矢。
五、總結(jié)
利用SPSSAU回歸分析高管信息以及企業(yè)規(guī)模資產(chǎn)對于研發(fā)投入的影響。首先對數(shù)據(jù)進(jìn)行處理包括數(shù)據(jù)取對數(shù)以及異常值檢查审胸。緊接著對于分析的基本關(guān)系進(jìn)行查看分尸,包括線性關(guān)系,相關(guān)關(guān)系以及正態(tài)性歹嘹,對處理后的數(shù)據(jù)進(jìn)行分析箩绍,從兩個(gè)方面進(jìn)行闡述,包括模型效果以及模型結(jié)果尺上,模型效果從F檢驗(yàn)材蛛、擬合優(yōu)度、多重共線性以及異方差檢驗(yàn)四個(gè)方面進(jìn)行說明怎抛。發(fā)現(xiàn)模型具有異方差性卑吭,使用Robust穩(wěn)健標(biāo)準(zhǔn)誤回歸方法進(jìn)行研究。得到的結(jié)論是:高管平均學(xué)歷, 高管團(tuán)隊(duì)人數(shù), 企業(yè)規(guī)模資產(chǎn)(元)會(huì)對研發(fā)投入(元)產(chǎn)生顯著的正向影響關(guān)系马绝。以及高管平均年齡會(huì)對研發(fā)投入(元)產(chǎn)生顯著的負(fù)向影響關(guān)系豆赏。對分析后的模型進(jìn)行穩(wěn)健性檢驗(yàn)發(fā)現(xiàn)模型具有穩(wěn)健性,分析結(jié)束富稻。
更多干貨請登錄SPSSAU官方網(wǎng)站查看掷邦。