title: 高計(jì)及stata應(yīng)用陳強(qiáng)版第4章_stata簡介
1.將數(shù)據(jù)導(dǎo)入stata
(1)用excel復(fù)制粘貼盏浙,選擇第一行是數(shù)據(jù)還是變量名
(2)file——import,然后導(dǎo)入各種樣式的數(shù)據(jù)
導(dǎo)入后將數(shù)據(jù)保存為.dta格式
2.變量標(biāo)簽的修改
打開倒數(shù)第三個(gè)圖標(biāo)嚷缭,相應(yīng)的變量標(biāo)簽可以直接修改稀火,注意stata中的變量名一般用小寫
3.調(diào)用數(shù)據(jù)及基本操作
(1)調(diào)用數(shù)據(jù)
use D:\Desktop\stata_陳強(qiáng)\nerlove.dta,clear
備注:調(diào)動(dòng)數(shù)據(jù),dta數(shù)據(jù)中不可以出現(xiàn)(1963)祟敛,否則不可識別
(2)審視數(shù)據(jù)
d
///觀察數(shù)據(jù)的變量名稱陷舅、標(biāo)簽等
label data "Nerlove 1963 paper"
///備注此數(shù)據(jù)集來自Nerlove 1963 paper
list tc q
///查看tc和q的具體數(shù)值脊阴,如果中間需要停止槽驶,可以點(diǎn)擊“break”圖標(biāo)
///左側(cè)命令窗口责嚷,單擊舊命令出現(xiàn)在命令窗口,雙擊則直接執(zhí)行
list tc q in 1/5
///羅列tc掂铐、q第1~第5個(gè)數(shù)值
list tc q if q>=10000
///羅列tc和q中所有q大于等于10000的樣本
drop if q>=10000
///扔掉所有不符合要求的樣本
///注意:刪掉的是整個(gè)樣本罕拂,而不是一個(gè)數(shù)值
4.考察數(shù)據(jù)的統(tǒng)計(jì)特征
sum
///沒有規(guī)定要觀察的變量,將顯示所有變量的obs(number)全陨、mean爆班、min、max
sum q
sum q if q>=10000
sum q,detail
///第一個(gè)顯示q的obs辱姨、mean柿菩、min、max
///第三個(gè)還會(huì)顯示百分位數(shù)(percentilea)雨涛、方差(variance)枢舶、偏度(skewness)、峰度(kurtosis)
tabulate pl
///顯示pl的經(jīng)驗(yàn)累積分布函數(shù)替久,tabulate意味“把.....做成表格”
pwcorr pl pf pk凉泄,sig star(.05)
///pwcorr意味“pariwise correlation(兩兩相關(guān))”
///sig表示顯示相關(guān)系數(shù)的顯著性水平,即p值(p值代表這個(gè)事件為假要推翻它的概率蚯根,所以p值越小越好)
///star(.05)表示將顯著性水平≤0.05的標(biāo)上星號
5.作圖
(1)畫柱狀圖
histogram q,width(1000) frequency
///histogram意為“直方圖”后众,此命令可以簡寫為“hist”
///width表示柱狀圖的寬為1000
///frequency表示縱坐標(biāo)為頻數(shù)
kdensity q
///這是連續(xù)的經(jīng)驗(yàn)分布圖。kernel是“核心颅拦,谷恋儆”、density是“密度”
(2)畫散點(diǎn)圖和線性擬合
scatter tc q
gen n=_n
///第一個(gè)n是新變量的含義矩距,_n表示第n個(gè)觀測值
scatter tc q,mlabel(n)mlabpos(6)
///mlabel(n)表示以n作為“mark label”的標(biāo)簽
///mlabpos(6)表示“mark label position”拗盒,把標(biāo)簽放在散點(diǎn)6點(diǎn)鐘的位置
twoway(scatter tc q)(lfit tc q)
graph save scatter1
twoway(scatter tc q)(qfit tc q)
graph save scatter2
graph combine scatter1.gph scatter2.gph
///lfit含義為“l(fā)inear fit”(線性擬合)
///qfit含義為“quadratic fit”(二次擬合)
///保存圖片
///將兩個(gè)圖片同時(shí)展示出來
6.生成新變量
///本章根據(jù)模型需要生成新的變量
g lntc=log(tc)
g lnq=log(q)
g lnpl=log(pl)
g lnpf=log(pf)
g lnpk=log(pk)
///產(chǎn)生新的變量
g q2=q^2
///生成平方項(xiàng)
g lnplpk=lnpl*lnpk
///生成交互項(xiàng)
g larg=(q>=10000)
///這個(gè)命令經(jīng)常用于生成虛擬變量。當(dāng)()中的邏輯語句為真時(shí)锥债,取值為1陡蝇;為假痊臭,取值為0
///在書中其實(shí)際含義為:產(chǎn)量在10000以上定義為大企業(yè)
rename larg large
///修改變量名
///接下來我們想變更大企業(yè)為產(chǎn)量在6000以上,但是仍然使用large這個(gè)變量名
///方法1:
replace large=(q>=6000)
///方法2:
drop large
g large=(q>=6000)
drop ln*
///刪除所有含有l(wèi)n的變量
7. stata的計(jì)算器功能
display log(2)
display normal(1.96)
///句式:display或者dis +表達(dá)
8. 線性回歸分析
(1)普通線性回歸
reg lntc lnq lnpl lnpk lnpf
///_cons表示常數(shù)項(xiàng)
///F統(tǒng)計(jì)量的p值為0.0000登夫,說明這個(gè)回歸方程顯著性程度很高
///Residual表示殘差平方和
///Root MSE表示這個(gè)方程的標(biāo)準(zhǔn)誤差
(2)線性回歸
reg lntc lnq lnpl lnpk lnpf,noc
///不要常數(shù)項(xiàng)的回歸
reg lntc lnq lnpl lnpk lnpf if q>=6000
reg lntc lnq lnpl lnpk lnpf if large
///只對大企業(yè)的樣本進(jìn)行回歸
reg lntc lnq lnpl lnpk lnpf if large==0
reg lntc lnq lnpl lnpk lnpf if ~large
///只對小企業(yè)的樣本進(jìn)行回歸
///~表示邏輯語句“非”
(3)預(yù)測擬合值
predict intchat
///計(jì)算被解釋變量的擬合值广匙,并將其幾位intchat
predict el,r
predict el2,residual
///計(jì)算殘差
///這里也可以看出,如果predict后邊什么選項(xiàng)都沒有恼策,默認(rèn)是估計(jì)擬合值的
(4)計(jì)算估計(jì)系數(shù)
///這里邊lnq的系數(shù)是1/r鸦致,是規(guī)模報(bào)酬的倒數(shù),所以可以利用lnq的系數(shù)估計(jì)規(guī)模報(bào)酬
display 1/_b[lnq]
///_b[lnq]表示lnq 的OLS系數(shù)估計(jì)值
(5)假設(shè)檢驗(yàn)
///由于規(guī)模報(bào)酬r=1.387涣楷,所以認(rèn)為可能存在規(guī)模報(bào)酬遞增的現(xiàn)象
test lnq=1
///這里的原假設(shè)是r=1分唾,即規(guī)模報(bào)酬不變
///發(fā)現(xiàn)p值很小,故拒絕原假設(shè)狮斗,故認(rèn)為存在規(guī)模報(bào)酬遞增
test (lnq=1)(lnpl+lnpk+lnpf=1)
///這里原假設(shè)有兩個(gè):①(lnq=1)②(lnpl+lnpk+lnpf=1)
///依舊發(fā)現(xiàn)p值為0绽乔,拒絕原假設(shè)
test lnpl lnpk
///這里隱含的假設(shè)是lnpl=0;lnpk=0
///發(fā)現(xiàn)p值很大碳褒,0.3多折砸,所以只能接受原假設(shè),這兩個(gè)系數(shù)都為0
testnl _b[lnpl]=_b[lnq]^2
///這里隱含的假設(shè)是lnpl的系數(shù)是lnq系數(shù)的平方
///發(fā)現(xiàn)p值很大沙峻,0.3多睦授,所以只能接受原假設(shè)
///所以你要看你檢驗(yàn)的是什么,p值越小摔寨,越要拒絕原假設(shè)
(6)新增變量圖
avplot lnq
///畫lnq的新增變量圖
avplots
///畫所有變量的新增變量圖
(7)約束回歸
///此部分為約束回歸
///如在經(jīng)濟(jì)理論“l(fā)npl+lnpk+lnpf=1”的條件下進(jìn)行回歸
constraint def 1 lnpl+lnpk+lnpf=1
cnsreg lntc lnq lnpl lnpk lnpf,c(1)
///“constraint def 1 ”定義約束條件1
///“cnsreg”含義“constraint regression”
cons def 2 lnq=1
cnsreg lntc lnq lnpl lnpk lnpf,c(1-2)
///定義約束條件2
///c(1-2)表明這個(gè)回歸要同時(shí)滿足約束條件1-(杠去枷,不是減)2
8. stata命令的存儲(chǔ)與調(diào)用
///r命令,如summarize調(diào)用結(jié)果用return list
sum q
return list
display r(sd)/r(mean)
///e命令祷肯,估計(jì)命令沉填,調(diào)用結(jié)果用ereturn list
reg tc q
ereturn list
9. stata命令庫的更新
(1)ssc意為“statistical software components”,即“統(tǒng)計(jì)軟件成分”佑笋,stata用戶寫的翼闹、Boston college維護(hù)的非官方統(tǒng)計(jì)程序集散地
(2)update all:更新stata命令庫
(3)ssc new:羅列ssc提供的非官方、最新的命令
(4)ssc hot:羅列ssc提供的非官方蒋纬、最流行的命令
(5)ssc install newcommand:安裝ssc非官方命令
(6)help ssc:有關(guān)ssc的信息
(7)search keyword和findit keyword都是搜索猎荠,后者范圍更廣
(8)sysdir:system directories,顯示stata的安裝路徑