SAS 程序冷知識(shí)——proc import中遇到的那些bug

一樱报、sheet名字過長的問題

當(dāng)我們用proc import導(dǎo)入一個(gè)excel文檔的時(shí)候沪编，經(jīng)常會(huì)出現(xiàn)這樣的情況：

這是因?yàn)閑xcel的sheet名字過長導(dǎo)致的（有時(shí)候DM老是把sheet名字弄的老長辨赐，還后面綴這日期逻翁，搞得每次更新文件都先改程序）龙填。

這種情況下最簡單的處理就是手動(dòng)修改excel的sheet名字失仁，但是一般作為正式項(xiàng)目尸曼，作為外部數(shù)據(jù)的excel是不好隨便改的。

既然不能改文件就只能改程序了萄焦，這里提供一個(gè)新的方法：

上面是導(dǎo)入失敗的程序控轿，下面是成功的

這兩段程序到底哪里有不同呢？最主要的是dbms=的值不同拂封，前者填寫的是excel茬射，后者填寫的是xlsx。需要注意的是填寫xlsx后冒签，原來的兩個(gè)參數(shù)就不能用了需要?jiǎng)h掉在抛。

二、全部導(dǎo)入成字符型

有的時(shí)候excel文檔是很討厭的萧恕，比如原來數(shù)據(jù)是1.20刚梭，當(dāng)轉(zhuǎn)成SAS的時(shí)候，程序會(huì)“貼心”的把變量轉(zhuǎn)成數(shù)值型票唆，從而丟掉了1.20后面的0朴读。這本來不影響分析，但是ORRES是要收集原始值的惰说，人家填的是1.20磨德，你怎么能寫1.2呢？這個(gè)時(shí)候就需要我們強(qiáng)制把excel所有變量都變成字符型。

其實(shí)這是個(gè)偷懶的小技巧典挑。我們只需要修改getnames=這個(gè)參數(shù)為no酥宴，這樣excel第一行就會(huì)被當(dāng)作變量的值而不是變量名或標(biāo)題了。而excel的第一行一般來說您觉，都是含有字符的拙寡，所以這樣會(huì)讓所有變量都被當(dāng)作字符型處理。

當(dāng)然琳水，我們還可以直接修改excel肆糕，在excel中就直接把所有變量都定義為字符的，但是這樣又犯了改原始數(shù)據(jù)的忌諱總之不推薦在孝。

最后需要注意的是诚啃，mixed選項(xiàng)是很重要的，如果是no的話私沮，一列中如果有純數(shù)字的話很容易被判定為數(shù)值型始赎，從而把那些有字符的變量置空。加了mixed=yes以后仔燕，一列中如果既有數(shù)字又有字符造垛，就會(huì)被判定為字符型。但如果一列真的是純數(shù)字晰搀，則會(huì)被判定為數(shù)值型五辽。另外，對(duì)于日期格式外恕，如果沒有mixed話杆逗，會(huì)把日期導(dǎo)成date格式的數(shù)值型，但使用mixed之后鳞疲，日期也會(huì)被當(dāng)作字符處理髓迎。

三、導(dǎo)入字符的長度問題

如果dbms=excel的話建丧，導(dǎo)入的字符變量最大長度默認(rèn)是1024，再長會(huì)截?cái)嗖ㄊ啤５侨绻尤胝Z句textsize=32767;可以設(shè)定這個(gè)長度翎朱。但是如果dbms=xlsx的話，就不會(huì)出這個(gè)問題尺铣。

網(wǎng)上說scantext是可以自動(dòng)掃描變量的最大寬度的拴曲，但是實(shí)際操作下來似乎并非如此，具體有什么作用還不知道凛忿。

四澈灼、預(yù)讀觀測(cè)問題

盡管使用了textsize=32767;，有些變量還是會(huì)被截?cái)唷＿@是因?yàn)镾AS在讀入的時(shí)候叁熔，是預(yù)先檢查excel前面的若干行來判斷長度和變量類型的委乌，所以如果特別長的值在最后幾行，可能會(huì)導(dǎo)致沒有檢查到改行荣回，從而變量長度比值要短遭贸，以至于發(fā)生了截?cái)唷＿@種情況就要用dbms=xlsx了心软。

最后編輯于：2021.06.07 08:18:44

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末壕吹，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子删铃，更是在濱河造成了極大的恐慌耳贬，老刑警劉巖，帶你破解...
沈念sama閱讀 206,839評(píng)論 6贊 482
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件猎唁，死亡現(xiàn)場(chǎng)離奇詭異咒劲，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)胖秒，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,543評(píng)論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門缎患，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人阎肝，你說我怎么就攤上這事挤渔。” “怎么了风题？”我有些...
開封第一講書人閱讀 153,116評(píng)論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵判导，是天一觀的道長。經(jīng)常有香客問我沛硅，道長眼刃，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 55,371評(píng)論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任摇肌，我火速辦了婚禮擂红，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘围小。我一直安慰自己昵骤，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 64,384評(píng)論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布肯适。她就那樣靜靜地躺著变秦，像睡著了一般。火紅的嫁衣襯著肌膚如雪框舔。梳的紋絲不亂的頭發(fā)上蹦玫，一...
開封第一講書人閱讀 49,111評(píng)論 1贊 285
城市分裂傳說
那天赎婚，我揣著相機(jī)與錄音，去河邊找鬼樱溉。笑死挣输，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的饺窿。我是一名探鬼主播歧焦，決...
沈念sama閱讀 38,416評(píng)論 3贊 400
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼肚医！你這毒婦竟也來了绢馍？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 37,053評(píng)論 0贊 259
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤肠套，失蹤者是張志新（化名）和其女友劉穎舰涌，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體你稚，經(jīng)...
沈念sama閱讀 43,558評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡瓷耙，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,007評(píng)論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了刁赖。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片搁痛。...
茶點(diǎn)故事閱讀 38,117評(píng)論 1贊 334
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖宇弛，靈堂內(nèi)的尸體忽然破棺而出鸡典，到底是詐尸還是另有隱情，我是刑警寧澤枪芒，帶...
沈念sama閱讀 33,756評(píng)論 4贊 324
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布彻况，位于F島的核電站，受9級(jí)特大地震影響舅踪，放射性物質(zhì)發(fā)生泄漏纽甘。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,324評(píng)論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一抽碌、第九天我趴在偏房一處隱蔽的房頂上張望悍赢。院中可真熱鬧，春花似錦货徙、人聲如沸泽裳。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,315評(píng)論 0贊 19
一樁弒父案破婆，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至胸囱，卻和暖如春祷舀，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,539評(píng)論 1贊 262
情欲美人皮
我被黑心中介騙來泰國打工裳扯，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留抛丽，地道東北人。一個(gè)月前我還...
沈念sama閱讀 45,578評(píng)論 2贊 355
代替公主和親
正文我出身青樓饰豺，卻偏偏與公主長得像亿鲜，于是被迫代替她去往敵國和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子冤吨，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,877評(píng)論 2贊 345

SAS 程序冷知識(shí)——proc import中遇到的那些bug

一樱报、sheet名字過長的問題

二、全部導(dǎo)入成字符型

三、導(dǎo)入字符的長度問題

四澈灼、預(yù)讀觀測(cè)問題

推薦閱讀更多精彩內(nèi)容