SAS數(shù)據(jù)的對比和清洗

數(shù)據(jù)的對比

SAS中對比兩個(gè)數(shù)據(jù)集的命令是proc compare怜校,它的基本格式如下:

proc compare <base=數(shù)據(jù)集 compare=數(shù)據(jù)集> <nosummary> <transpose>;
by 變量1 變量2;
id 變量1 變量2间影;
run;

其中,proc compare語句是調(diào)用數(shù)據(jù)比較過程茄茁,選項(xiàng)basecompare分別指定被比較的兩個(gè)數(shù)據(jù)集魂贬; nosummary的作用是不顯示一些概括性的結(jié)果;而transpose則是按記錄顯示不一致的結(jié)果裙顽,默認(rèn)是按變量顯示不一致的結(jié)果付燥。

id語句通常指定索引變量,如id號愈犹,默認(rèn)顯示行號键科。舉例說明:

forexample.png

一旦發(fā)現(xiàn)輸入錯(cuò)誤的數(shù)據(jù)集,便可以使用if ...then...語句進(jìn)行修改漩怎,舉例說明:

ifthen.png

數(shù)據(jù)的清洗

1.查找和刪除重復(fù)值

SAS利用proc sort過程來查找和刪除重復(fù)值勋颖,它的基本格式如下:

proc sort <data=數(shù)據(jù)集> <out=數(shù)據(jù)集>  <nouniquekey> <nodupkey>;
by <descending> 變量1 <descending> 變量2 ...;
run;

其中,若不指定out選項(xiàng)勋锤,那么排序后的數(shù)據(jù)集將覆蓋原有數(shù)據(jù)集饭玲;nouniquekey的作用是輸出重復(fù)值,nodupkey選項(xiàng)是輸出唯一值叁执。

by語句指定排序的變量茄厘,可以指定多個(gè),默認(rèn)按升序排序徒恋。

2.擴(kuò)展內(nèi)容:first.變量和last.變量

SAS的sort過程會自動(dòng)產(chǎn)生兩個(gè)變量:first.變量和last.變量蚕断,這兩個(gè)變量分別表示某變量某個(gè)值的第一個(gè)和最后一個(gè)觀測。直接舉例說明其用法:

WX20200421-151353@2x.png

在上述例子中入挣,需要注意的是亿乳,用set語句賦值數(shù)據(jù)集時(shí),也要加上by語句,否則SAS不認(rèn)first.idlast.id葛假。

除此之外障陶,如果想要過濾掉觀測的第一行,可以在proc print;前面加一句if not first.id;

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末聊训,一起剝皮案震驚了整個(gè)濱河市抱究,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌带斑,老刑警劉巖鼓寺,帶你破解...
    沈念sama閱讀 222,252評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異勋磕,居然都是意外死亡妈候,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,886評論 3 399
  • 文/潘曉璐 我一進(jìn)店門挂滓,熙熙樓的掌柜王于貴愁眉苦臉地迎上來苦银,“玉大人,你說我怎么就攤上這事赶站♂B玻” “怎么了?”我有些...
    開封第一講書人閱讀 168,814評論 0 361
  • 文/不壞的土叔 我叫張陵贝椿,是天一觀的道長想括。 經(jīng)常有香客問我,道長团秽,這世上最難降的妖魔是什么主胧? 我笑而不...
    開封第一講書人閱讀 59,869評論 1 299
  • 正文 為了忘掉前任,我火速辦了婚禮习勤,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘焙格。我一直安慰自己图毕,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,888評論 6 398
  • 文/花漫 我一把揭開白布眷唉。 她就那樣靜靜地躺著予颤,像睡著了一般。 火紅的嫁衣襯著肌膚如雪冬阳。 梳的紋絲不亂的頭發(fā)上蛤虐,一...
    開封第一講書人閱讀 52,475評論 1 312
  • 那天,我揣著相機(jī)與錄音肝陪,去河邊找鬼驳庭。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的饲常。 我是一名探鬼主播蹲堂,決...
    沈念sama閱讀 41,010評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼贝淤!你這毒婦竟也來了柒竞?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,924評論 0 277
  • 序言:老撾萬榮一對情侶失蹤播聪,失蹤者是張志新(化名)和其女友劉穎朽基,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體离陶,經(jīng)...
    沈念sama閱讀 46,469評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡稼虎,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,552評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了枕磁。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片渡蜻。...
    茶點(diǎn)故事閱讀 40,680評論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖计济,靈堂內(nèi)的尸體忽然破棺而出茸苇,到底是詐尸還是另有隱情,我是刑警寧澤沦寂,帶...
    沈念sama閱讀 36,362評論 5 351
  • 正文 年R本政府宣布学密,位于F島的核電站,受9級特大地震影響传藏,放射性物質(zhì)發(fā)生泄漏腻暮。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,037評論 3 335
  • 文/蒙蒙 一毯侦、第九天 我趴在偏房一處隱蔽的房頂上張望哭靖。 院中可真熱鬧,春花似錦侈离、人聲如沸试幽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,519評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽铺坞。三九已至,卻和暖如春洲胖,著一層夾襖步出監(jiān)牢的瞬間济榨,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,621評論 1 274
  • 我被黑心中介騙來泰國打工绿映, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留擒滑,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 49,099評論 3 378
  • 正文 我出身青樓,卻偏偏與公主長得像橘忱,于是被迫代替她去往敵國和親赴魁。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,691評論 2 361