Stata14安裝
ssc install asdoc, replace //導(dǎo)入輸出命令
數(shù)據(jù)處理
1.數(shù)據(jù)打開
use "E:\data\suto.dta"
sysuse suro.dta
打開部分變量:use make price using "E:\data\suto.dta"
打開部分樣本:use "E:\data\suto.dta" in 5/10(第5個(gè)到10)
打開某些特征樣本:use "E:\data\suto.dta" if foreign=1
打開網(wǎng)絡(luò)數(shù)據(jù) use http://www.stata-press.com/data/r9/nlswork
1.2. 數(shù)據(jù)的類型和壓縮
1.2.1 數(shù)據(jù)類型
- 數(shù)值型
- 字符型
- 日期型(1999年1月1日->19990101)
1.2.2 數(shù)據(jù)壓縮
compress [變量]
clear #清空內(nèi)存
set obs 1 #樣本容量設(shè)置為1眼溶,stata默認(rèn)類型float
gen a=1 #變量a=1
describe #描述變量基本情況
1.3. 數(shù)據(jù)類型的轉(zhuǎn)化
1.3.1 字符型轉(zhuǎn)為數(shù)值型
sysuse water.dta,clear
destring year production captial, replace #replace指轉(zhuǎn)化后的數(shù)據(jù)替換原有數(shù)據(jù)
若原來的字符型變量還有空格
sysuse water.dta,clear
destring date, replace ignore("")
若原來的字符型變量還有特殊字符
sysuse water.dta,clear
destring price, gen(price_1) ignore("$")
destring 服務(wù)時(shí)長(zhǎng),gen(t) ignore(時(shí)趁窃,分)
1.3.1 數(shù)值型轉(zhuǎn)為字符型
sysuse water.dta,clear
tostring year gdp loan, replace
2 數(shù)據(jù)導(dǎo)入
2.1 輸入數(shù)據(jù)
1.菜單輸入
2.命令輸入
clear
input str10name remarks
Mike 98
John 78
save chengji
2.2 使用已保存的Stata數(shù)據(jù)
insheet耘擂,讀取文本數(shù)據(jù)
insheet using E:\data\citywater.csv
infile漓滔,讀取無固定格式文本數(shù)據(jù)
infile year production labor using E:\data\citywater.csv
- infix换帜,讀取無固定格式文本數(shù)據(jù)
infix gender 1 number 3-5 math 7-8 english 10-11 using E:\data\citywater.csv
3 數(shù)據(jù)的整理
3.1 數(shù)據(jù)的標(biāo)簽和排序
1.數(shù)據(jù)標(biāo)簽
- 數(shù)據(jù)庫添加標(biāo)簽:
label data "1978年美國汽車橫截面數(shù)據(jù)"
- 變量添加標(biāo)簽:
label variable mpg "每加侖油行駛里程數(shù)"
- 分類變量添加標(biāo)簽:
label define foreignlabel 0 "Domestic" 1 "Foreign"
label values foreign foreignlabel #foreignlabel標(biāo)簽名
- label dir #查看表情相關(guān)內(nèi)容
3.2 排序數(shù)據(jù)
sort price
gsort + price
3.3 數(shù)據(jù)的拆分
- 數(shù)據(jù)橫向拆分
刪除變量或觀測(cè)值:
sysuse water,clear
drop capital labor
save E:/data/wateroutput,replace
保留變量或觀測(cè)值:
sysuse water,clear
keep capital labor
save E:/data/wateroutput,replace
- 數(shù)據(jù)縱向拆分
sysuse car,clear
drop if foreign==1
save E:/data/domesticoutput,replace
sysuse car,clear
keep if foreign==1
save E:/data/foreignoutput,replace
數(shù)據(jù)合并
-
數(shù)據(jù)橫向合并
-
數(shù)據(jù)縱向合并
拆分字符串:2019-07-02
use E:\Stata\data\serviceData2019.dta
gen year=substr(服務(wù)時(shí)間,1,4)
gen month=substr(服務(wù)時(shí)間,6,2)
gen day=substr(服務(wù)時(shí)間,9,2)
gen date=substr(服務(wù)時(shí)間,1,10) //20190702
數(shù)據(jù)的長(zhǎng)寬轉(zhuǎn)換
reshape long english science,i(number name) j(year)
參考:
《stata統(tǒng)計(jì)分析與應(yīng)用》第二版 周光肅等著