Stata 與模型的設(shè)定

介紹模型設(shè)定的相關(guān)內(nèi)容,包括虛擬變量的使用逃魄、經(jīng)濟結(jié)構(gòu)變動的檢驗荤西、遺漏變量的檢驗、自變量數(shù)量的選擇伍俘、極端數(shù)據(jù)的診斷與處理等方面的內(nèi)容皂冰。

1.虛擬變量處理

對于定性數(shù)據(jù), 通常并不能將其直接納入模型中進行回歸分析养篓,因為這樣的分析并不符合經(jīng)濟學(xué)理論秃流, 所以這時需要引入虛擬變量進行處理。一般情況下柳弄,如果分類變量總共有N類舶胀,為了避免多重共線性的出現(xiàn), 通常只引入N-1個虛擬變量碧注。

image-20191117211642003.png

image-20191117211705269.png
  1. 為了便于比較嚣伐,首先生成整個時期中不含虛擬變量的消費函數(shù)方程走贪,所使用到的命令為:

regress financevalue gdp

image-20191117211824715.png

[圖片上傳中...(image-20191117211705269.png-c763b3-1574492559433-0)]

  1. 如果認為在2003 年培他,銀行業(yè)改革導(dǎo)致了金融業(yè)經(jīng)營的變動溜畅,這時需要引入虛擬變量將 模型分成兩段進行回歸篮洁,步驟如下:

    • 生成虛擬變量

      generate dummy=0
      replace dummy=1 if year>=2003
      
    • 生成虛擬變量dummy 和解釋變量gdp 的互動項边臼,使用命令:

      generate dummy_gdp = dummy*gdp

    • 將虛擬變量納入回歸方程

      reg financevalue gdp dummy dummy_gdp

image-20191117212951989.png

2.經(jīng)濟結(jié)構(gòu)變動的Chow檢驗

在時間序列模型之中嗤瞎,需要十分注重模型系數(shù)的穩(wěn)定性椿访, Chow 檢驗提供了一個較為嚴(yán) 謹(jǐn)?shù)臋z驗經(jīng)濟結(jié)構(gòu)變動的方法手趣。

image-20191117233210459-1574065994089.png

1.手動進行Chow檢驗

檢驗的方法是分別進行三次回歸壳影。檢驗中國金融業(yè)增加值函數(shù)是否在2003 年以后發(fā)生了結(jié)構(gòu)變化的操作過程如下:

  1. 首先拱层,生成整個時期的回歸方程, 計算出這時的殘差平方和宴咧,輸入命令:

    regress financevalue gdp  //生成關(guān)于金融業(yè)增加值的函數(shù)financevalue =α+?gdp
    predict e , residual      //生成殘差序列
    gen a=e^2
    egen b=sum (a)            //生成變量b 根灯,使其值為序列a的和,即殘差平方和</pre>
    
    1. 其次掺栅, 生成2003 年以前序列的回歸方程烙肺,計算出前半段時期的殘差平方和,輸入命令:
     regress financevalue gdp if year<2003
     predict e1 if year<2003 , residual
     gen al=e1^2
     egen bl=sum(a1)
    
  2. 生成2003 年以后序列的回歸方程氧卧,然后計算出這后半段時期的殘差平方和桃笙,輸入命令:

     regress financevalue gdp if year<2003
     predict e1 if year<2003 , residual
     gen al=e1^2
     egen bl=sum(a1)
  1. 最后, 計算F 統(tǒng)計量的值假抄, 并與臨界值進行比較怎栽,輸入命令.

    gen f=((b-b1-b2)/(2))/((bl+b2)/(29-2*2))
    sum f

    image-20191117234051010-1574065999494.png

2.自動進行Chow檢驗

  1. 下載chow檢驗命令,一般選擇第一個鏈接安裝

    findit chow

image-20191118094844272.png
  1. 利用financevalue.dta 數(shù)據(jù)丽猬,檢驗2002 年是否為結(jié)構(gòu)變化點,可使用命令:

    chow financevalue gdp, chow(year>2002)

    在這個命令語句中熏瞄, cbow fmancevalue gdp 說明要對變量financevalue 和gdp 進行檢驗脚祟, cbow(year>2002)說明結(jié)構(gòu)變動可能出現(xiàn)在2003 年,命令執(zhí)行的結(jié)果同手動法一致强饮。

3. 遺漏變量的檢驗

遺漏變量屬于解釋變量選取錯誤的一種由桌,因為某些數(shù)據(jù)確實難以獲得,但是有時這種遺 漏將會大大降低模型的精確度邮丰。假設(shè)正確模型如下所示:

image-20191118100125494-1574066003667.png

如果在模型設(shè)定中遺漏了一個與被解釋變量相關(guān)的變量X2 ,即所設(shè)定的模型為:

image-20191118100148357-1574066005381.png

遺漏變量有3種情況:

image-20191118100356924-1574066007318.png

Stata 提供了兩種檢驗是否存在遺漏變量的方法: 一種是Link檢驗行您,另一種是Ramsey 檢驗。Link 檢驗的基本思想是: 如果模型的設(shè)定是正確的剪廉,那么y的擬合值的平方項將不應(yīng)具有解釋能力娃循。Ramsey 檢驗的基本思想是:如果模型設(shè)定無誤,那么擬合值和解釋變量的高階項都不應(yīng)再有解釋能力斗蒋。

實驗

wage=工資(單位:元/小時) , educ=受教育年限(單位: 年) , exper=工作經(jīng)驗?zāi)晗?單位: 年) , tenure=任 職年限〈單位: 年) , lwage=工資的對數(shù)值捌斧。

image-20191118100642517-1574066009917.png

分別利用Link 方法和Ramsey 方法檢驗?zāi)P?strong>lwage =?1educ +?2exper +?3tenure是否遺漏了重要的解釋變量。

1.使用Link方法檢驗遺漏變量

    use c : \data\chinawage.dta , clear
    reg l wage educ exper tenure
    linktest
image-20191118105608317-1574066012374.png
image-20191118105724828.png
gen educ2=educ^2
gen exper2=exper^2
reg lwage educ exper tenure educ2 exper2
linktest
image-20191118105749282-1574066029464.png

從圖7. 5 中可以看出泉沾,經(jīng)過添加解釋變量后的模型擬合優(yōu)度有了一定程度的提高捞蚂,而且通過Link 檢驗可以看出此時hatsq項的p 值為0. 758 ,無法拒絕hatsq系數(shù)為零的假設(shè)跷究,說明被解釋變量lwage 的擬合值的平方項不再具有解釋能力姓迅,所以可以得出結(jié)論: 新模型基本沒有遺漏重要的解釋變量。

2.使用Ramsey方法檢驗遺漏變量

    gen educ2=educ^2
    gen exper2=exper^2
    reg lwage educ exper tenure educ2 exper2
    linktest
image-20191118110042394-1574066036576.png

在圖7.6 中俊马,第1 個圖表仍然是回歸結(jié)果丁存,第2 個圖表是Ramsey 檢驗的結(jié)果,不難發(fā)現(xiàn)Ramsey 檢驗的原假設(shè)是模型不存在遺漏變量潭袱,檢驗的p 值為0 . 5762 柱嫌,沒有拒絕原假設(shè),即認為原模型不存在遺漏變量屯换。

為了進一步驗證添加變量是否會改變Ramsey 檢驗的結(jié)果,同樣采取Link 檢驗中的方法与学, 生成受教育年限educ 和工作經(jīng)驗?zāi)晗辝xper 的平方項彤悔,重新進行回歸并進行檢驗,命令如下:

  gen educ2=educ^2
  gen exper2=exper^2
  reg lwage educ exper tenure educ2 exper2
  estat ovtest
image-20191118110322606-1574066043793.png

調(diào)整之后的檢驗結(jié)果,可以發(fā)現(xiàn)此時檢驗的p 值為0 . 6326 索守,無法拒絕原假設(shè)晕窑,即認為模型不再存在遺漏變量。

4. 自變量數(shù)量的選擇

人們總是希望建立具有經(jīng)濟意義而又簡潔的模型卵佛,在現(xiàn)實的經(jīng)濟研究過程中杨赤,通常使用信息準(zhǔn)則來確定解釋變量的個數(shù)敞斋,較為常用的信息準(zhǔn)則有兩個。

image-20191118121750463-1574066046150.png

實驗

中國工資的橫截面數(shù)據(jù)疾牲,變量主要包括: wage=工資(單位:元/小時) , educ=受教育年限(單位:年) , exper=工作經(jīng)驗?zāi)晗?單位:年) , tenure=任職年限(單位:年) , lwage=工資的對數(shù)值植捎。

image-20191118121933047-1574066049554.png
    use c:\data\chinawage.dta, clear
    reg lwage educ exper tenure
    estat ic
image-20191118122113686-1574066051580.png

AIC 值為一37.77 , BIC 值為一24 .00 阳柔。

加入教育年限educ和工作經(jīng)驗?zāi)晗辝xper的平方項焰枢,建立新模型lwage = ?o +?1educ + ?2exper + ?3 tenure +?4 educ2 + ?5 exper2 , 然后重新對其進行回歸井計算舌剂, 命令如下:

gen educ2=educ^2
gen exper2=exper^2
reg lwage educ exper tenure educ2 exper2
estat ic
image-20191118122710607-1574066054046.png

AIC 值為-39.91,BIC 值為-19.25济锄。第2 個模型的信息準(zhǔn)則值更小,所以此模型優(yōu)于第一個模型霍转。

5. 極端數(shù)據(jù)的診斷與處理

在全體觀測值中荐绝,會有一些樣本和總體樣本距離較遠,這些樣本在回歸中可能會對斜率或者截距的估計產(chǎn)生較大的影響避消,從而使得估計值和真值的差距較大很泊,所以在實際應(yīng)用中,首先應(yīng)通過繪制散點圖的方式觀測是否有極端數(shù)值的存在沾谓,如果有委造,應(yīng)該去掉這些極端數(shù)值再進行回歸分析。 ? 如果解釋變量過多或者是面板數(shù)據(jù)均驶,繪圖的方式并不直觀昏兆,通常使用leverage 影響力方法來判斷該數(shù)據(jù)是否是極端數(shù)據(jù)。若數(shù)據(jù)的leverage 影響力值高于平均值妇穴, 則對回歸系數(shù)影響較大爬虱,這時可能會產(chǎn)生極端數(shù)據(jù)的影響。

實驗

以price 為因變量腾它, mpg(每加侖油所行駛的英里數(shù)) 跑筝、weight(汽車重量)和foreign(是否是進口車) 為自變量建立回歸模型,找出樣本數(shù)據(jù)中存在的極端數(shù)據(jù)瞒滴。

image-20191118124133128-1574066057836.png

建立回歸模型price =?0+?1mpg+ ?2weight + ?3foreign 曲梗,為分析汽車數(shù)據(jù)中是否存在極端值,在Stata 中輸入如下命令:

regress price mpg weight foreign
predict lev,leverage
gsort -lev
sum lev
list in 1/3    //計算lev值妓忍,并將由大到小前3 位的數(shù)據(jù)顯示出來
image-20191118124537137-1574066060415.png

在結(jié)果中可以看到lev 的均值為0. 0541 虏两,而最大的lev 值為0.3001,所以該觀測值有可能為極端數(shù)據(jù)世剖,可以采取進一步的方法進行處理定罢,從而保證模型的精確性。

處理的方法一般有兩種: 一種方法為直接去掉極端值:另一種方法則選擇其他更為恰當(dāng)?shù)哪P瓦M行回歸分析旁瘫。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末祖凫,一起剝皮案震驚了整個濱河市琼蚯,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌惠况,老刑警劉巖遭庶,帶你破解...
    沈念sama閱讀 221,198評論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異售滤,居然都是意外死亡罚拟,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評論 3 398
  • 文/潘曉璐 我一進店門完箩,熙熙樓的掌柜王于貴愁眉苦臉地迎上來赐俗,“玉大人,你說我怎么就攤上這事弊知∽璐” “怎么了?”我有些...
    開封第一講書人閱讀 167,643評論 0 360
  • 文/不壞的土叔 我叫張陵秩彤,是天一觀的道長叔扼。 經(jīng)常有香客問我,道長漫雷,這世上最難降的妖魔是什么瓜富? 我笑而不...
    開封第一講書人閱讀 59,495評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮降盹,結(jié)果婚禮上与柑,老公的妹妹穿的比我還像新娘。我一直安慰自己蓄坏,他們只是感情好价捧,可當(dāng)我...
    茶點故事閱讀 68,502評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著涡戳,像睡著了一般结蟋。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上渔彰,一...
    開封第一講書人閱讀 52,156評論 1 308
  • 那天嵌屎,我揣著相機與錄音,去河邊找鬼胳岂。 笑死编整,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的乳丰。 我是一名探鬼主播,決...
    沈念sama閱讀 40,743評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼内贮,長吁一口氣:“原來是場噩夢啊……” “哼产园!你這毒婦竟也來了汞斧?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,659評論 0 276
  • 序言:老撾萬榮一對情侶失蹤什燕,失蹤者是張志新(化名)和其女友劉穎粘勒,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體屎即,經(jīng)...
    沈念sama閱讀 46,200評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡庙睡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,282評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了技俐。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片乘陪。...
    茶點故事閱讀 40,424評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖雕擂,靈堂內(nèi)的尸體忽然破棺而出啡邑,到底是詐尸還是另有隱情,我是刑警寧澤井赌,帶...
    沈念sama閱讀 36,107評論 5 349
  • 正文 年R本政府宣布谤逼,位于F島的核電站,受9級特大地震影響仇穗,放射性物質(zhì)發(fā)生泄漏流部。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,789評論 3 333
  • 文/蒙蒙 一纹坐、第九天 我趴在偏房一處隱蔽的房頂上張望枝冀。 院中可真熱鬧,春花似錦恰画、人聲如沸宾茂。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽跨晴。三九已至,卻和暖如春片林,著一層夾襖步出監(jiān)牢的瞬間端盆,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評論 1 271
  • 我被黑心中介騙來泰國打工费封, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留焕妙,地道東北人。 一個月前我還...
    沈念sama閱讀 48,798評論 3 376
  • 正文 我出身青樓弓摘,卻偏偏與公主長得像焚鹊,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子韧献,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,435評論 2 359

推薦閱讀更多精彩內(nèi)容