回歸是一種統(tǒng)計(jì)方法贯溅,可讓我們了解自變量和因變量之間的關(guān)系招刨。
逐步回歸是回歸分析中一種篩選變量的過(guò)程呐粘,我們可以使用逐步回歸從一組候選變量中構(gòu)建回歸模型十偶,讓系統(tǒng)自動(dòng)識(shí)別出有影響的變量。
理論說(shuō)明
逐步回歸腻菇,是通過(guò)逐步將自變量輸入模型胳螟,如果模型具統(tǒng)計(jì)學(xué)意義昔馋,并將其納入在回歸模型中。同時(shí)移出不具有統(tǒng)計(jì)學(xué)意義的變量糖耸。最終得到一個(gè)自動(dòng)擬合的回歸模型秘遏。其本質(zhì)上還是線性回歸。
一嘉竟、案例背景
研究人員針對(duì)血壓與年齡邦危,體重,體表面積舍扰,持續(xù)時(shí)間倦蚪,脈搏率、壓力水平之間是否存在關(guān)系進(jìn)行研究边苹。
二陵且、操作步驟
首先,可以分別對(duì)變量做相關(guān)分析或散點(diǎn)圖个束,初步了解各自變量X與因變量Y的關(guān)系慕购。
登錄SPSSAU,選擇【通用方法】--【相關(guān)】或【可視化】--【散點(diǎn)圖】茬底。
從相關(guān)分析結(jié)果看沪悲,年齡、體重阱表、體表面積殿如、脈搏頻率與血壓有顯著的正相關(guān)關(guān)系。
然后最爬,再利用逐步回歸進(jìn)行分析握截。選擇【進(jìn)階方法】--【逐步回歸】。
逐步回歸分析是在回歸分析的基礎(chǔ)上烂叔,加入了一項(xiàng)功能,即自動(dòng)化移除掉不顯著的X固歪,其結(jié)果各指標(biāo)意義與回歸分析均一致蒜鸡。逐步回歸通常用于探索研究中。
在分析時(shí)牢裳,可首先對(duì)模型情況進(jìn)行分析逢防,然后分析X的顯著性,并判斷X對(duì)Y的影響關(guān)系大小及方向蒲讯。
根據(jù)回歸結(jié)果顯示忘朝,最終模型共包含年齡、體重判帮、體表面積共3個(gè)自變量局嘁。R方值為0.995溉箕,意味著年齡,體重,體表面積可以解釋血壓的99.5%變化原因,說(shuō)明模型構(gòu)建較好悦昵。
最終具體分析可知:
年齡的回歸系數(shù)值為0.702(t=15.961肴茄,p=0.000<0.01),意味著年齡會(huì)對(duì)血壓產(chǎn)生顯著的正向影響關(guān)系但指。
體重的回歸系數(shù)值為0.906(t=18.490寡痰,p=0.000<0.01),意味著體重會(huì)對(duì)血壓產(chǎn)生顯著的正向影響關(guān)系棋凳。
體表面積的回歸系數(shù)值為4.627(t=3.042拦坠,p=0.008<0.01),意味著體表面積會(huì)對(duì)血壓產(chǎn)生顯著的正向影響關(guān)系剩岳。
三贞滨、其他說(shuō)明
逐步回歸雖然是很好的選擇自變量的方法,但同時(shí)這種方法也存在一些缺陷:
首先卢肃,該方法按一定順序添加或刪除變量疲迂,所以最終會(huì)得到由該順序確定的自變量組合,由系統(tǒng)自動(dòng)判斷哪些變量應(yīng)該保留莫湘,哪些需要移除尤蒿,可能會(huì)出現(xiàn)核心研究變量被移除的情況。
其次幅垮,如果逐步回歸結(jié)果會(huì)收到樣本量的影響腰池,一般需要適當(dāng)?shù)拇髽颖静拍塬@得較為可靠的分析結(jié)果。
以上就是本次分享的內(nèi)容忙芒,登錄SPSSAU官網(wǎng)了解更多示弓。