第三章:巧婦難為無米之炊-數(shù)據(jù)準(zhǔn)備
1育八、理解數(shù)據(jù)
字段與記錄、數(shù)據(jù)類型--文字與文字赦邻、數(shù)據(jù)表髓棋、二維表與一維表轉(zhuǎn)換(數(shù)據(jù)透視表)
2、數(shù)據(jù)來源
導(dǎo)入數(shù)據(jù)--分列、來自網(wǎng)站導(dǎo)入等
問卷錄入要求--數(shù)值題按声、單選題(1膳犹、2、3签则、4)须床、多選題(01或者數(shù)字)、排序題(1渐裂、2豺旬、3......)、開放性文字題(分類錄入)
第四章:三心二意-數(shù)據(jù)處理
1柒凉、數(shù)據(jù)處理的內(nèi)容:數(shù)據(jù)清洗族阅、數(shù)據(jù)加工
2、數(shù)據(jù)清洗
(1)重復(fù)數(shù)據(jù)的處理
a.函數(shù):COUNTIF(range膝捞,計算條件)
b.高級篩選--不重復(fù)的數(shù)據(jù)
c.數(shù)據(jù)透視表
d.刪除重復(fù)數(shù)據(jù)
(2)缺失數(shù)據(jù)的處理--定位輸入(ctrl+G)-可定位空值
a.用樣本統(tǒng)計量的值替代缺失值耘分,如樣本均值
b.應(yīng)統(tǒng)計模型計算結(jié)果替代缺失值,如回歸模型绑警、判別模型等
c.將缺失值的記錄刪除--會導(dǎo)致樣本量變少
d.保留缺失值記錄,僅在分析時做必要排除
----利用ctrl+enter快捷鍵央渣,可以一鍵在選中的單元格內(nèi)用一樣的公式或者一樣的內(nèi)容
(3)檢查數(shù)據(jù)邏輯錯誤
a.IF函數(shù)--IF(邏輯表達(dá)式結(jié)果為TRUE或者FALSE计盒,為TRUE時返回的值,為FALSE時返回的值)
b.用條件格式標(biāo)記錯誤
3芽丹、數(shù)據(jù)加工
(1)數(shù)據(jù)抽取--提取字段中某些信息
a.字段分列
b.函數(shù)法:LEFT(待提取的字段北启,指定字符數(shù)量)--提取字符串左邊指定個數(shù)的字符
RIGHT(待提取的字段,指定字符數(shù)量)--提取字符串右邊指定個數(shù)的字符
CONCATENATE(TEXT1,TEXT2...)--J將幾個文本字符合并為一個文本字符串
Vlookup(查找值拔第,查找范圍咕村,希望返回匹配的列數(shù),是否精確匹配)
(2)數(shù)據(jù)計算
a.簡單計算
b.函數(shù)計算-AVERAGE\SUM\TODAY\NOW\DATE\MONTH\DAY\DATEDIF(返回兩個日期的間隔天數(shù))
(3)數(shù)據(jù)分組--VLOOKUP(模糊匹配)
(4)數(shù)據(jù)轉(zhuǎn)換
a.行列轉(zhuǎn)換--選擇性粘貼-轉(zhuǎn)置
b.Hlookup-按行查找蚊俺,用法與Vlookup類似
Isnumber-看是否是數(shù)值懈涛,是返回true,不是返回false
Seach(要查找的字符串泳猬、要在那個字符串中查找批钠、從第幾個字符串開始查找)-返回指定字符串在原始字符串中首次出現(xiàn)的位置
4、數(shù)據(jù)抽樣
Rand()-返回[0,1]均勻分布隨機(jī)數(shù)