T1.3 Excel-Data Cleansing

數(shù)據(jù)清洗

查重去重

缺失值定位與處理

檢測數(shù)據(jù)邏輯



3.1 查詢重復(fù)數(shù)據(jù)

A 函數(shù)法: COUNTIF(range,criteria)

重復(fù)標記:

在C列中CX—共重復(fù)出現(xiàn)了幾次

第二次重復(fù)標記:


在C1到CX中CX出現(xiàn)了幾次


B 高級篩選法(去重優(yōu)選2) ☆☆☆☆


【數(shù)據(jù)】——【篩選-高級】


選中區(qū)域必須包含變量名蕉世,復(fù)制到的區(qū)域選擇起始位置即可茫多,會生成新變量

C 條件格式法(查重優(yōu)選) ☆☆☆☆

【條件格式】——【突出顯示單元格規(guī)則】——【重復(fù)值】

D 數(shù)據(jù)透視表法


會默認第一個值為變量名,不參與統(tǒng)計:選中區(qū)域須包含變量名


分別拉動目標變量到【行標簽】、Σ數(shù)值
計數(shù)就是頻次,頻次超過1的就是重復(fù)項

3.2 刪除重復(fù)數(shù)據(jù)

A 菜單欄刪除


【數(shù)據(jù)】——【刪除重復(fù)項】


如果有多個變量要擴展,確認選中區(qū)域是否包含變量名
不會生成新變量




3.3 缺失值處理

A 常見方式

a. 用樣本統(tǒng)計量的值代替缺失值民宿,如Mean

b. 用統(tǒng)計模型計算出來一個值代替缺失值,如回歸模型

c. 刪除含缺失值的Case

d. 不作處理像鸡,在分析時排除含缺失值的個案

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?——適用于【樣本量大】+【缺失值少】+【變量之間無高度相關(guān)】

B 定位輸入

定位:Ctrl+G

【編輯】——【查找和選擇】——<定位條件>——<空值>——選中所有空值

輸入:Ctrl+Enter

選中之后輸入“XX”,然后按Ctrl+Enter哈恰,所有選中單元格都輸入了XX

C 查找替換

查找:Ctrl+F

替換:Ctrl+H

定位:Ctrl+G


3.4 檢查數(shù)據(jù)邏輯錯誤

A 利用IF函數(shù)檢查錯誤——“最多選擇3項”


如果B2:G2中不為0的值超過3個只估,則返回false,反之返回true


?B 利用條件格式標記錯誤——“只能出現(xiàn)0/1兩個值”


選中目標區(qū)域——【條件格式】——【突出顯示單元格】——【其他規(guī)則】
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市着绷,隨后出現(xiàn)的幾起案子蛔钙,更是在濱河造成了極大的恐慌,老刑警劉巖荠医,帶你破解...
    沈念sama閱讀 218,386評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件吁脱,死亡現(xiàn)場離奇詭異,居然都是意外死亡彬向,警方通過查閱死者的電腦和手機兼贡,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,142評論 3 394
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來娃胆,“玉大人遍希,你說我怎么就攤上這事±锓常” “怎么了凿蒜?”我有些...
    開封第一講書人閱讀 164,704評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長胁黑。 經(jīng)常有香客問我废封,道長,這世上最難降的妖魔是什么丧蘸? 我笑而不...
    開封第一講書人閱讀 58,702評論 1 294
  • 正文 為了忘掉前任漂洋,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘氮发。我一直安慰自己渴肉,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,716評論 6 392
  • 文/花漫 我一把揭開白布爽冕。 她就那樣靜靜地躺著仇祭,像睡著了一般。 火紅的嫁衣襯著肌膚如雪颈畸。 梳的紋絲不亂的頭發(fā)上乌奇,一...
    開封第一講書人閱讀 51,573評論 1 305
  • 那天,我揣著相機與錄音眯娱,去河邊找鬼礁苗。 笑死,一個胖子當(dāng)著我的面吹牛徙缴,可吹牛的內(nèi)容都是我干的试伙。 我是一名探鬼主播,決...
    沈念sama閱讀 40,314評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼于样,長吁一口氣:“原來是場噩夢啊……” “哼疏叨!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起穿剖,我...
    開封第一講書人閱讀 39,230評論 0 276
  • 序言:老撾萬榮一對情侶失蹤蚤蔓,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后糊余,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體秀又,經(jīng)...
    沈念sama閱讀 45,680評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,873評論 3 336
  • 正文 我和宋清朗相戀三年贬芥,在試婚紗的時候發(fā)現(xiàn)自己被綠了吐辙。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,991評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡蘸劈,死狀恐怖袱讹,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情昵时,我是刑警寧澤捷雕,帶...
    沈念sama閱讀 35,706評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站壹甥,受9級特大地震影響救巷,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜句柠,卻給世界環(huán)境...
    茶點故事閱讀 41,329評論 3 330
  • 文/蒙蒙 一浦译、第九天 我趴在偏房一處隱蔽的房頂上張望棒假。 院中可真熱鬧,春花似錦精盅、人聲如沸帽哑。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,910評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽妻枕。三九已至,卻和暖如春粘驰,著一層夾襖步出監(jiān)牢的瞬間屡谐,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,038評論 1 270
  • 我被黑心中介騙來泰國打工蝌数, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留愕掏,地道東北人。 一個月前我還...
    沈念sama閱讀 48,158評論 3 370
  • 正文 我出身青樓顶伞,卻偏偏與公主長得像饵撑,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子唆貌,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,941評論 2 355

推薦閱讀更多精彩內(nèi)容