本文以SPSSAU系統(tǒng)為例躯舔,針對(duì)線性回歸的常見問題進(jìn)行匯總說明驴剔。
關(guān)于線性回歸的分析思路及操作步驟,可閱讀下方鏈接文章:
SPSSAU:線性回歸分析思路總結(jié)粥庄!簡(jiǎn)單易懂又全面丧失!?
①問題一:SPSSAU多元線性回歸在哪兒?
【通用方法】--【線性回歸】惜互。
當(dāng)考察一個(gè)自變量對(duì)因變量的影響稱為一元線性回歸布讹,多于一個(gè)自變量的情況稱為多元線性回歸。
②問題二:控制變量如何放置训堆?
控制變量指可能干擾模型的項(xiàng)描验,比如年齡,學(xué)歷等基礎(chǔ)信息坑鱼。從軟件角度來看膘流,并沒有“控制變量”這樣的名詞。“控制變量”就是自變量睡扬,所以直接放入“自變量X”框中即可盟蚣。
③問題三:自變量為定類數(shù)據(jù)如何分析?
如果自變量X為定類數(shù)據(jù)卖怜,一般作為控制變量(可能對(duì)模型有干擾因而放入的項(xiàng))放入模型屎开,但并不對(duì)其進(jìn)行分析。如果一定要分析马靠,此時(shí)應(yīng)該進(jìn)行虛擬變量(也稱啞變量)奄抽。
使用【數(shù)據(jù)處理】--【生成變量】里的啞變量設(shè)置后再放入。
了解啞變量相關(guān)理論甩鳄,可閱讀下方鏈接文章:
SPSSAU:什么是虛擬變量逞度?怎么設(shè)置才正確??
④問題四:數(shù)據(jù)里有多個(gè)Y妙啃,線性回歸Y只能放一個(gè)
線性回歸模型中要求只有一個(gè)因變量档泽,一個(gè)或多個(gè)自變量。
如果是同一個(gè)維度的題揖赴,因變量超過1個(gè)馆匿,可以使用SPSSAU【數(shù)據(jù)處理】--【生成變量】里的平均值功能。將多個(gè)Y合并成一個(gè)整體燥滑,再進(jìn)行分析渐北。
如果是不同維度的指標(biāo)可以將因變量一個(gè)一個(gè)單獨(dú)進(jìn)行分析∶。或用路徑分析赃蛛、結(jié)構(gòu)方程模型進(jìn)行分析。
⑤問題五:線性回歸有效樣本量不足搀菩,需要多少樣本量呕臂?
有效樣本不足是指分析時(shí),可以進(jìn)行分析的樣本量低于方法需要的樣本量。解決方法是加大樣本量肪跋。一般來說歧蒋,至少要求樣本量起碼是變量數(shù)的5-10倍,結(jié)果更具備參考意義澎嚣。
⑥問題六:相關(guān)分析顯示正相關(guān)疏尿,回歸分析顯示負(fù)相關(guān),如何解釋易桃?
相關(guān)分析是只簡(jiǎn)單考慮兩個(gè)變量之間的關(guān)系褥琐,分析時(shí)不考慮其他控制變量的影響。
回歸分析則是綜合所有進(jìn)入模型的自變量對(duì)因變量的結(jié)果而成的晤郑,在控制了其他進(jìn)入回歸方程的變量之后得到的影響關(guān)系敌呈。
所以得出結(jié)果不一致也非常正常贸宏。當(dāng)相關(guān)分析、線性回歸結(jié)果出現(xiàn)以下的矛盾情況:
①回歸分析存在影響關(guān)系磕洪,但是卻沒有相關(guān)關(guān)系吭练。此時(shí)建議以‘沒有相關(guān)關(guān)系作為結(jié)論’。
②有負(fù)向影響關(guān)系析显,但卻是正向相關(guān)關(guān)系鲫咽。此時(shí)建議以‘有相關(guān)關(guān)系但沒有回歸影響關(guān)系作為結(jié)論’。
⑦問題七:回歸結(jié)果看標(biāo)準(zhǔn)化還是非標(biāo)準(zhǔn)化谷异?
標(biāo)準(zhǔn)化回歸系數(shù)是消除了量綱影響后的回歸系數(shù)分尸,可以用來比較各個(gè)自變量的“重要性大小”。
如果目的在于預(yù)測(cè)模型歹嘹,一般使用非標(biāo)準(zhǔn)化回歸系數(shù)箩绍。
⑧問題八:線性回歸因變量不在樣本問題中?
有時(shí)候由于問卷設(shè)計(jì)問題尺上,導(dǎo)致直接缺少了Y(沒有設(shè)計(jì)對(duì)應(yīng)的問卷題項(xiàng))材蛛,建議可以考慮將X所有題項(xiàng)概括計(jì)算平均值來表示Y。(使用“ 生成變量”的 平均值功能)
如果問卷中并沒有設(shè)計(jì)出Y對(duì)應(yīng)的題項(xiàng)怎抛,沒有其它辦法可以處理卑吭。
⑨問題九:逐步回歸與分層回歸、線性回歸的區(qū)別抽诉,結(jié)果不一致怎么解釋陨簇?
逐步回歸是多元線性回歸中一種選擇自變量的方法吐绵。分別把每一個(gè)變量都選入模型中迹淌,每次都保留系數(shù)顯著水平最高的變量,剔除不顯著的變量己单,通過多次的選入和剔除最終得到系數(shù)的顯著的回歸方程唉窃。適合自變量個(gè)數(shù)較多時(shí)使用。
分層回歸本質(zhì)是線性回歸纹笼,區(qū)別在于分層回歸可分為多層纹份,主要用于模型的對(duì)比。
如果出現(xiàn)逐步回歸廷痘、分層回歸與線性回歸結(jié)果不一致的情況蔓涧,主要是用于選入模型的自變量不同導(dǎo)致。逐步回歸會(huì)讓系統(tǒng)自動(dòng)識(shí)別出有影響的自變量X笋额,最終得到的模型與線性回歸中元暴,自己分析的結(jié)果很可能出現(xiàn)不一致的情況。
最終以哪個(gè)結(jié)果為準(zhǔn)兄猩,應(yīng)結(jié)合專業(yè)知識(shí)和研究目的選擇茉盏。比如某個(gè)核心研究項(xiàng)很重要鉴未,在逐步回歸結(jié)果中沒有體現(xiàn),此時(shí)更應(yīng)選擇其他方法進(jìn)行研究鸠姨。
以上就是今天分享的內(nèi)容铜秆,更多干貨內(nèi)容可登錄SPSSAU官網(wǎng)查看。