Stata數(shù)據(jù)清理整理(小白)

目錄

1.數(shù)據(jù)導入

1.1導入方法

2.數(shù)據(jù)管理

2.1瀏覽排序

2.2基本描述

2.3變量特征

2.4定義新變量

2.5轉(zhuǎn)化—— "reshape"

2.6合并

3.命令結構和選項


數(shù)據(jù)導入

導入方法

“use” 命令加數(shù)據(jù)的路徑和名稱。

先用“cd” 命令進入數(shù)據(jù)所在的目錄蟋定,然后用“use” 命令直接加數(shù)據(jù)的名稱來導入數(shù)據(jù)碳抄。

TIPS:適合批量

點擊菜單、圖標

其他格式文件:

-格式轉(zhuǎn)化(軟件StatTransfer)

-"insheet using" 命令導入

數(shù)據(jù)管理

瀏覽排序

"list"

"sort"升序

"gsort"降序

基本描述

"describe" 可得本容量嚷节、變量個數(shù)聂儒、變量名稱、變量存儲類型和格式以及變量的基本含義

“rename”,“format”和“l(fā)abel”分別可修改變量名稱硫痰、變量格式或變量含義等內(nèi)容

變量特征

"summarize" 包括與每個變量對應的樣本容量衩婚、算術平均數(shù)、標準差效斑、最小值和最大值等

"ameans, centile, correlate, count"

"inspect, tabstat, tabulate"

定義新變量

在既有變量的基礎上定義新變量—— "generate"

eg:定義一個新的虛擬變量“male”非春。當該變量取值為 0 時,個體為女性缓屠;取值為1時奇昙,個體為男性。那么我可以運行下面的命令:

generate male = abs(female - 1)

female 是已經(jīng)存在的變量——其取 1 時敌完,個體為女性储耐;取 0 時,個體為男性滨溉。abs(.)是絕對值函數(shù)什湘。 那么,一列名為 “male”的新變量就生成了晦攒。

generate 的擴展命令—— "egen"及分步生成變量

eg:還可以通過如下的方式來生成

generate male = 0 if female = = 1 replace male = 1 if male = = .

Step1:對所有的女性樣本定義變量 male 的取值闽撤。

如果只運行第一行命令, 會發(fā)現(xiàn):對于女性樣本脯颜,male 取值為 0哟旗;而對于男性樣本,male的取值為“.”,即缺漏栋操。

Step2:補缺漏的值.

我們加上第二行命令闸餐。 “replace”命令用來修改變量的取值。第二行命令的含義是:將變量 male 所有缺漏的值更改為 1讼庇。

轉(zhuǎn)化—— "reshape"

截面數(shù)據(jù)被形象地稱作寬(wide)數(shù)據(jù)绎巨,而面板數(shù)據(jù)被形象地稱作長(long)數(shù)據(jù)。

TIPS:注意變量得數(shù)據(jù)類型

詳細說明 :Tips?25:reshape改變數(shù)據(jù)格式_Stata_新浪博客

合并

導入的數(shù)據(jù)叫 master data 或 data in memory蠕啄,合并進來的數(shù)據(jù)叫 using data 或data on disk

關鍵點?紐帶變量(我認為就類似于數(shù)據(jù)庫里的鍵场勤,唯一識別碼,eg:id)

橫向合并歼跟,增加變量—— merge

stata區(qū)分大小寫和媳,同名變量要有相同的存儲類型

merge中,紐帶變量如果不唯一哈街,則要用選項"uniqusing"或者uniqmaster"

縱向合并留瞳,增加樣本—— append

匹配合并——

Step1:排序

對所有要合并數(shù)據(jù)中的紐帶變量進行排序

Step2:合并

多數(shù)據(jù)合并

詳細說明:Tips?24:merge合并數(shù)據(jù)_Stata_新浪博客

匹配合并示例


兩個文件,20位學生的成績

“mid.dta”:期中考試成績骚秦,其中學號為15 的學生沒有成績

“final.dta”:期末成績她倘,其中學號為09 的學生沒有成績

紐帶變量:學號?

?合并算法

把兩個文件中的數(shù)據(jù)分別按照學號排序璧微。

以 master data 中的學號為主,將 using data 中具有相同學號的數(shù)據(jù)一條一條并進來硬梁;如果某學號在 using data 中沒有記錄前硫,則在相應的變量中用小圓點代替(如09 號學生)。

如果某學號在 master data 中無記錄荧止、但在 using data 中有記錄(如15 號學生)屹电,則暫不合并;待所有在 master data 中存在的學號都合并完之后跃巡,再考慮那些只在 using data 中出現(xiàn)的學號危号。

命令結構和選項

斜體?需要將其替換成相應的內(nèi)容 (如將 depvar 替換成真正的因變量)

粗體and非斜體?在實際操作中,將其照搬素邪。

方括號?方括號括起來的部分在實際操作中可有可無外莲,沒有括起來的部分必須出現(xiàn)在命令中(比如,reg 命令至少要包含 reg 和 depvar 兩項娘香。如果是“reg depvar”苍狰,就表示拿因變量對常數(shù)項作回歸)

選項?“options”之前還得加個逗號办龄。


命令示例:


試運行regress并解讀

命令語句:reg wage educ exper if female= =1 in 1/100 [aweight=educ], noc l(90)

這條命令是拿工資對教育水平和工作經(jīng)驗作回歸烘绽,回歸的樣本限定為序號從 1 到 100 中的女性;考慮到可能存在的異方差俐填,用教育水平作權重安接;此外,回歸不包括常數(shù)項英融,且需要報告 90%水平上的置信區(qū)間盏檐。

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市驶悟,隨后出現(xiàn)的幾起案子胡野,更是在濱河造成了極大的恐慌,老刑警劉巖痕鳍,帶你破解...
    沈念sama閱讀 212,454評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件硫豆,死亡現(xiàn)場離奇詭異,居然都是意外死亡笼呆,警方通過查閱死者的電腦和手機熊响,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,553評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來诗赌,“玉大人汗茄,你說我怎么就攤上這事∶簦” “怎么了洪碳?”我有些...
    開封第一講書人閱讀 157,921評論 0 348
  • 文/不壞的土叔 我叫張陵递览,是天一觀的道長。 經(jīng)常有香客問我瞳腌,道長非迹,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,648評論 1 284
  • 正文 為了忘掉前任纯趋,我火速辦了婚禮憎兽,結果婚禮上,老公的妹妹穿的比我還像新娘吵冒。我一直安慰自己纯命,他們只是感情好,可當我...
    茶點故事閱讀 65,770評論 6 386
  • 文/花漫 我一把揭開白布痹栖。 她就那樣靜靜地躺著亿汞,像睡著了一般。 火紅的嫁衣襯著肌膚如雪揪阿。 梳的紋絲不亂的頭發(fā)上疗我,一...
    開封第一講書人閱讀 49,950評論 1 291
  • 那天,我揣著相機與錄音南捂,去河邊找鬼吴裤。 笑死,一個胖子當著我的面吹牛溺健,可吹牛的內(nèi)容都是我干的麦牺。 我是一名探鬼主播,決...
    沈念sama閱讀 39,090評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼鞭缭,長吁一口氣:“原來是場噩夢啊……” “哼剖膳!你這毒婦竟也來了?” 一聲冷哼從身側響起岭辣,我...
    開封第一講書人閱讀 37,817評論 0 268
  • 序言:老撾萬榮一對情侶失蹤吱晒,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后沦童,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體仑濒,經(jīng)...
    沈念sama閱讀 44,275評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,592評論 2 327
  • 正文 我和宋清朗相戀三年搞动,在試婚紗的時候發(fā)現(xiàn)自己被綠了躏精。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,724評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡鹦肿,死狀恐怖叽躯,靈堂內(nèi)的尸體忽然破棺而出修噪,到底是詐尸還是另有隱情康辑,我是刑警寧澤芹啥,帶...
    沈念sama閱讀 34,409評論 4 333
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜股冗,卻給世界環(huán)境...
    茶點故事閱讀 40,052評論 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望和蚪。 院中可真熱鬧止状,春花似錦、人聲如沸攒霹。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,815評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽催束。三九已至集峦,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間抠刺,已是汗流浹背塔淤。 一陣腳步聲響...
    開封第一講書人閱讀 32,043評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留速妖,地道東北人高蜂。 一個月前我還...
    沈念sama閱讀 46,503評論 2 361
  • 正文 我出身青樓,卻偏偏與公主長得像买优,于是被迫代替她去往敵國和親妨马。 傳聞我的和親對象是個殘疾皇子挺举,可洞房花燭夜當晚...
    茶點故事閱讀 43,627評論 2 350

推薦閱讀更多精彩內(nèi)容