第二章 數(shù)據(jù)準(zhǔn)備
1.? ? 理解數(shù)據(jù)
1. 1? 字段與記錄
以上表為例,這樣的成績(jī)表從數(shù)據(jù)分析角度來看洒沦,是一個(gè)典型的數(shù)據(jù)庫豹绪。該表第一行的“學(xué)號(hào)”、“姓名”申眼、“性別”瞒津、“總分”等被稱為字段,這是數(shù)據(jù)庫的術(shù)語括尸,每位同學(xué)的基本情況和成績(jī)則構(gòu)成了一條條的數(shù)據(jù)記錄巷蚪,如變2所示。
從數(shù)據(jù)分析的角度來理解字段和記錄的概念:
? ? 字段是實(shí)物或現(xiàn)象的某種特征姻氨。比如成績(jī)表中的“學(xué)號(hào)”钓辆、“姓名”、“性別”肴焊、“總分”等都是字段前联,在統(tǒng)計(jì)學(xué)中成為變量。
? ? 記錄是事物或現(xiàn)象某種特征的具體表現(xiàn)娶眷。比如成績(jī)表中的“性別”可以是男或女似嗤,“總分”可以是237或者230等,記錄也成為數(shù)據(jù)或變量值届宠。
數(shù)據(jù)需要由字段與記錄共同組合而成烁落。
1.2? 數(shù)據(jù)類型
以表3 職工信息表為例,看看表中數(shù)據(jù)大概分為幾類豌注?
表中數(shù)據(jù)大概可分為數(shù)字伤塌、文字、日期三類轧铁。這也是我們常用的數(shù)據(jù)類型每聪,當(dāng)然還有如貨幣等其他數(shù)據(jù)類型。若想知道數(shù)據(jù)到底有多少類,可在Excel中用單元格格式查看所有的數(shù)據(jù)類型药薯,如圖4所示绑洛。
從圖4所示的對(duì)話框中可以看到各種不同的數(shù)據(jù)類型,如:數(shù)值童本、文本真屯、日期、貨幣穷娱、會(huì)計(jì)專用绑蔫、時(shí)間、百分比泵额、分?jǐn)?shù)晾匠、科學(xué)計(jì)數(shù)、特殊等梯刚。
Excel中雖然有這么多數(shù)據(jù)類型,但最終可以分為兩大類薪寓。
? ? 字符型數(shù)據(jù)
字符型數(shù)據(jù)是不具計(jì)算能力的文字?jǐn)?shù)據(jù)類型亡资。包括中文字符、英文字符向叉、數(shù)字字符(非數(shù)值型)等字符锥腻。例如上文成績(jī)表中的“姓名”? “性別”? “總評(píng)”? 三個(gè)變量均為字符型數(shù)據(jù)母谎,職工信息表中的“員工號(hào)”? “姓名”? “性別”? “部門”? 四個(gè)變量為字符型數(shù)據(jù)瘦黑。
? ? 數(shù)值型數(shù)據(jù)
是直接使用自然數(shù)或度量單位進(jìn)行計(jì)量的數(shù)值數(shù)據(jù)。例如成績(jī)表中的 “語文”? “數(shù)學(xué)”? “英語” 三科成績(jī)匯總即得到 “總分” 這個(gè)字段奇唤,職工信息表中幸斥,可按 “入職日期” 計(jì)算工齡,這些數(shù)據(jù)就是數(shù)值型數(shù)據(jù)咬扇。對(duì)于數(shù)值型數(shù)據(jù)甲葬,我們可以用算數(shù)方法進(jìn)行匯總和分析,這點(diǎn)是區(qū)分?jǐn)?shù)據(jù)是否屬于數(shù)值型數(shù)據(jù)的重要依據(jù)懈贺。
1.3? ? 數(shù)據(jù)表
由字段经窖、記錄和數(shù)據(jù)類型構(gòu)成數(shù)據(jù)表。數(shù)據(jù)分析所需要的數(shù)據(jù)表有一定的要求梭灿,具體如表5所示:
什么是一維表画侣、什么是二維表?
這里的 “維” 指的是分析數(shù)據(jù)的角度堡妒,2006年配乱、2007年、2008年從數(shù)據(jù)的角度來說,都是 “年份” 的范疇宪卿,是描述各省GDP的一個(gè)因素的诵,若要換成一維表,則應(yīng)該使用同一個(gè)字段佑钾,將年份單獨(dú)作為列標(biāo)簽西疤。
1.4? 問卷錄入
我們經(jīng)常接觸到的調(diào)查問卷數(shù)據(jù),其錄入格式也是有講究的休溶。
? 單選題
答案只能有一個(gè)代赁,編碼時(shí)只需定義一個(gè)變量,即給該題留一列進(jìn)行數(shù)據(jù) 的錄入兽掰。錄入時(shí)可采用1芭碍、2、3孽尽、4分別代表A窖壕、B、C杉女、D四個(gè)選項(xiàng)瞻讽,例如被調(diào)查者選 “C” 則錄入 “3” 。
? 多選題
答案可以有多個(gè)選項(xiàng)熏挎,又分為項(xiàng)數(shù)不定多選和項(xiàng)數(shù)限定多選速勇。多選題的錄入有兩種方式:二分法和多重分類法。
? ? ? ? ? 二分法坎拐。把每一個(gè)相應(yīng)選項(xiàng)定義為一個(gè)變量烦磁,每一個(gè)變量值均作如下定義: “0” 代表未選, “1” 代表已選哼勇,即對(duì)于被調(diào)查者選中的選項(xiàng)錄入 “1” 都伪,對(duì)未選的選項(xiàng)錄入 “0” 。
? ? ? ? ? 多重分類法积担。事先定義錄入的數(shù)值院溺,比如1、2磅轻、3珍逸、4、5聋溜、6谆膳、7分別代表A贸宏、B间驮、C、D藻丢、E、F杨帽、G漓穿,并且根據(jù)限選的項(xiàng)數(shù)確定應(yīng)錄入的變量個(gè)數(shù)。
? 排序題
排序題的錄入與多重分類法類似注盈,先定義錄入的數(shù)值晃危,1、2老客、3僚饭、4、5胧砰、6鳍鸵、7分別代表A、B尉间、C偿乖、D、E哲嘲、F汹想,然后按照被調(diào)查者填寫的順序錄入選項(xiàng)。
? 開放性文字題
如果可能的話可以按照含義相似的答案進(jìn)行歸類編碼撤蚊,轉(zhuǎn)換成多選題進(jìn)行分析。如果答案內(nèi)容比較豐富损话、不容易歸類侦啸,就應(yīng)對(duì)這些問題做定性分析。
2.? ? 初識(shí)Excel
Excel主要包括這幾個(gè)模塊:菜單操作丧枪、函數(shù)光涂、圖表、宏的應(yīng)用拧烦。
2.1? ? 菜單操作
? ? 小技巧? 自動(dòng)調(diào)整列寬/行距:如選中A列至D列忘闻,鼠標(biāo)移到A、B恋博、C齐佳、D任意列標(biāo)之間,直到光標(biāo)變成左右?guī)Ъ^的十字圖形债沮,然后雙擊選中的所有列即自動(dòng)調(diào)整為最合適的列寬了炼吴。這種方法還可以用于調(diào)整合適的行距。
2.2? ? 函數(shù)
關(guān)于函數(shù)疫衩,需說明幾點(diǎn)硅蹦。
? ? 每個(gè)函數(shù)都有一個(gè)函數(shù)名,都有一對(duì)括號(hào)將函數(shù)包圍住,參數(shù)間用逗號(hào)分隔童芹,參數(shù)可以是公式涮瞻、函數(shù)、值假褪。例如 “=IF(A3>100,40,0)” 署咽,其中函數(shù)名為 “IF” ,公式 “A3>100” 和數(shù)值 “40” 都是參數(shù)嗜价。
? ? 在單元格內(nèi)等號(hào)作為函數(shù)的開始艇抠,函數(shù)可以嵌套。
2.3? ? 圖表
作圖表的主要目的是表現(xiàn)數(shù)據(jù)久锥、傳遞信息家淤。每一幅圖標(biāo)都必須有中心思想,即你要傳遞的主要信息瑟由。
生成圖表后絮重,有三種方式對(duì)其進(jìn)行編輯。
? ? 第一種歹苦,用鼠標(biāo)單擊圖形中的任意地方青伤,接著會(huì)發(fā)現(xiàn)Excel的功能區(qū)里多了一個(gè) “圖表工具” 的功能組,其中包含了 “設(shè)計(jì)”殴瘦、“布局” 和 “格式” 選項(xiàng)卡狠角,可以根據(jù)自己的需求編輯該圖表。
? ? 第二種蚪腋,鼠標(biāo)雙擊該圖表的任意區(qū)域丰歌,即可彈出對(duì)應(yīng)的格式對(duì)話框。
? ? 第三種屉凯,按 “Ctrl+1” 快捷鍵立帖,同樣可以彈出對(duì)應(yīng)的格式對(duì)話框,在進(jìn)行編輯悠砚。
對(duì)于后兩種方式需要補(bǔ)充說明一點(diǎn):鼠標(biāo)選擇的是哪一元素晓勇,即彈出哪一元素的格式對(duì)話框。
2.4? ? 宏
宏是一個(gè)指令集灌旧。是可運(yùn)行任意次數(shù)的一個(gè)操作或一組操作绑咱。若要在Excel中重復(fù)執(zhí)行多個(gè)任務(wù),則可以錄制一個(gè)宏來自動(dòng)執(zhí)行枢泰。例如每個(gè)月要上交一份職位表羡玛,表中需要將發(fā)生崗位變化的員工編號(hào)設(shè)置為紅色和加粗格式,就可以創(chuàng)建一個(gè)宏宗苍,每月運(yùn)行該宏將這些格式變更迅速應(yīng)用到職位表中稼稿。
Ⅰ? ? 打開 “視圖” 選項(xiàng)卡薄榛,單擊 “宏” 的下拉菜單,先選中 “使用相對(duì)引用” 選項(xiàng)让歼,在單擊 “錄制宏” 選項(xiàng)敞恋,如圖2.4.1所示。
Ⅱ? ? 此時(shí)谋右,會(huì)彈出一個(gè) “錄制新宏” 對(duì)話框硬猫,在里面可以對(duì)宏進(jìn)行命名,可以根據(jù)宏實(shí)現(xiàn)的功能來命名改执。這里我們將其命名為 “紅色加粗” 啸蜜,然后,設(shè)置 “快捷鍵” 辈挂,這是 “紅色加粗” 宏的專用快捷鍵衬横,注意不要與Excel本身內(nèi)置的快捷鍵重復(fù),如圖2.4.2终蒂。
注意蜂林,在Excel主界面左下角的就緒旁有一個(gè)圖表,如下圖拇泣,單擊它可以實(shí)施 “錄制宏” 和 “停止錄制” 的操作噪叙。
Ⅲ? ? 在工作表中執(zhí)行你的操作。比如這里霉翔,我們將A1單元格的數(shù)據(jù)變成紅色并加粗睁蕾。
Ⅳ? ? 再單擊 “視圖” 選項(xiàng)卡→ “宏” → “停止錄制” 。
Ⅴ? ? 選擇任意其他單元格或者區(qū)域债朵,再單擊 “視圖” 選項(xiàng)卡→ “宏” → “查看宏” 子眶,此時(shí)會(huì)彈出一個(gè)宏窗口,選擇剛才的 “紅色加粗” 宏葱弟,并單擊 “執(zhí)行” 按鈕。使用剛剛自行設(shè)置的快捷鍵 “Ctrl+Q” 也會(huì)達(dá)到同樣的效果猜丹。
2.5? ? 快捷鍵
下表為最基礎(chǔ)且非常方便的快捷鍵:
Excel的功能區(qū)附帶了新的快捷方式芝加,稱為按鍵提示:
Ⅰ? ? 按Alt鍵,顯示按鍵提示射窒,如圖2.5.2所示藏杖,Excel界面上的選項(xiàng)卡和按鈕即刻出現(xiàn)了帶方框的按鍵提示。
Ⅱ? ? 在鍵盤上按下對(duì)應(yīng)選項(xiàng)卡的按鍵脉顿,即刻就能在功能區(qū)上打開該選型卡蝌麸。例如,對(duì)于 “視圖” 選項(xiàng)卡艾疟,按字母鍵 “W” 来吩;對(duì)于 “公式” 選項(xiàng)卡敢辩,按字母鍵 “M” 。打開的選項(xiàng)卡將繼續(xù)顯示其包含的所有功能的按鍵提示弟疆。
例如戚长,想實(shí)行 “視圖” 選項(xiàng)卡中的 “凍結(jié)窗口” 功能,先按字母鍵 “W” 怠苔,將顯示 “視圖” 主選項(xiàng)卡所有功能的快捷鍵同廉,如圖2.5.3所示。
再按下 “F” 鍵柑司,就快速地完成了凍結(jié)窗口的操作了迫肖。
3.? ? 數(shù)據(jù)來源
取得數(shù)據(jù)的方式可以分為兩種:導(dǎo)入外部數(shù)據(jù)和自己錄入數(shù)據(jù)。
3.1? ? 導(dǎo)入外部數(shù)據(jù)
導(dǎo)入外部數(shù)據(jù)常見的來源有兩張攒驰,文本和網(wǎng)站數(shù)據(jù)蟆湖。
? ? 導(dǎo)入文本數(shù)據(jù)
Ⅰ? ? 單擊 “數(shù)據(jù)” 選項(xiàng)卡,選擇 “自文本” 選項(xiàng)讼育,Excel會(huì)自動(dòng)彈出相對(duì)應(yīng)的對(duì)話框帐姻。
Ⅱ? ? 找到保存的 “問卷錄入結(jié)果.txt” 文件。
還有一種方式奶段,在 “文件” 選項(xiàng)卡中饥瓷,打開 “文件” 選項(xiàng),Excel會(huì)自動(dòng)彈出對(duì)話框痹籍,在 “文件類型” 中選擇 “文本文件” 呢铆,然后,找到需要的文件蹲缠,此時(shí)將會(huì)彈出 “文本導(dǎo)入向?qū)А?對(duì)話框棺克。如圖3.1-1所示。
Ⅲ? ? 在上圖對(duì)話框中有兩個(gè)選項(xiàng) “分隔符號(hào)” 和 “固定寬度” 线定。若文本文件中的列標(biāo)簽以制表符娜谊、冒號(hào)、分號(hào)斤讥、空格或者其他字符分隔纱皆,則選擇 “分隔符號(hào)” ;若想自己設(shè)定每列分隔的具體位置芭商,則選擇 “固定寬度” 派草。單擊 “下一步” 按鈕,得到圖3.1-2對(duì)話框铛楣。
Ⅳ? ? 如上圖對(duì)話框中列出了Tab鍵近迁、分號(hào)、逗號(hào)簸州、空格的分隔符以供選擇鉴竭。若分隔符是其他字符歧譬,則選擇 “其他” 復(fù)選框,在后面的文本框中輸入字符拓瞪。單擊 “下一步” 缴罗,彈出文本導(dǎo)入向?qū)У?步的對(duì)話框,如圖3.1-3祭埂。
Ⅴ? ? 若不需要將某列導(dǎo)入Excel中面氓,可以在 “數(shù)據(jù)預(yù)覽” 中選擇此列,后勾選 “不導(dǎo)入此列(跳過)” 蛆橡。不需要?jiǎng)h除某列舌界,故選擇 “常規(guī)” 即可,單擊 “完成” 按鈕泰演。
Ⅵ? ? 彈出 “導(dǎo)入數(shù)據(jù)” 對(duì)話框呻拌,在其中選擇存放數(shù)據(jù)的位置,單擊下圖中按鈕拖動(dòng)或縮放單元格區(qū)域睦焕,再次點(diǎn)擊該按鈕回復(fù)對(duì)話框→ “確定” 藐握。
Ⅶ? ? 返回工作表,文本文件中的數(shù)據(jù)就會(huì)按所設(shè)置的格式自動(dòng)導(dǎo)入到其中垃喊。
? ? 導(dǎo)入網(wǎng)站數(shù)據(jù)
Ⅰ? ? 單擊 “數(shù)據(jù)” 選項(xiàng)卡猾普,選擇 “自網(wǎng)站” 選項(xiàng),Excel會(huì)彈出 “新建Web查詢” 對(duì)話框本谜。
Ⅱ? ? 在對(duì)話框的地址欄里輸入要導(dǎo)入數(shù)據(jù)的網(wǎng)址初家, 單擊 “轉(zhuǎn)到” 按鈕,單擊下圖黃色箭頭按鈕乌助,使其變成圖中綠色√溜在。
Ⅲ? 單擊 “導(dǎo)入” , 彈出 “導(dǎo)入數(shù)據(jù)” 對(duì)話框他托,在工作表中選擇需要放置數(shù)據(jù)的區(qū)域掖肋,單擊 “確定”。
更新數(shù)據(jù)的方式有三種:即時(shí)刷新赏参、定時(shí)刷新志笼、打開文件時(shí)自動(dòng)刷新
? ? 即時(shí)刷新。單擊 “數(shù)據(jù)” 主選項(xiàng)卡→ “刷新數(shù)據(jù)”即可登刺。
? ? 定時(shí)刷新或打開文件時(shí)自動(dòng)刷新籽腕。在上圖方法二的快捷菜單中有個(gè) “數(shù)據(jù)區(qū)域?qū)傩浴?嗡呼,選擇該選項(xiàng)纸俭,彈出 “外部數(shù)據(jù)區(qū)域?qū)傩浴?對(duì)話框,勾選? “刷新頻率” 復(fù)選框南窗,選擇刷新的間隔時(shí)間揍很,就能實(shí)現(xiàn)定時(shí)刷新郎楼。在“外部數(shù)據(jù)區(qū)域?qū)傩浴?對(duì)話框中還有? “打開文件時(shí)刷新數(shù)據(jù)” 復(fù)選框。
? ? 我們也可以直接在網(wǎng)站上復(fù)制所需的數(shù)據(jù)窒悔,再進(jìn)行粘貼呜袁。
在工作表中粘貼數(shù)據(jù)后,數(shù)據(jù)區(qū)域右下角會(huì)出現(xiàn)一個(gè) “粘貼” 按鈕简珠,單擊阶界,選擇 “可刷新的Web查詢” 命令。
3.2? ? 手動(dòng)輸入數(shù)據(jù)
? ? 快速設(shè)置單元格格式
我們直接輸入 “1/3” 單元格默認(rèn)將它轉(zhuǎn)成日期格式聋庵,顯示成 “1月3號(hào)” 膘融,但如果我們先輸入 “0+空格” ,再輸入 “1/3” 即可祭玉。
? ? 選中單元格氧映,直接按 “F2” 鍵,則單元格就進(jìn)入編輯模式脱货。
? ? Ctrl+1 彈出設(shè)置單元格對(duì)話框岛都。
? ? 省時(shí)省力的填充柄 “+”
? ? 讓 “0” 站首位
比如在錄入數(shù)據(jù)時(shí),輸入 “007” 振峻,但輸進(jìn)去就變成 “7” 臼疫,如何解決。
上面的情況是Excel將輸入的值默認(rèn)成數(shù)值類型的數(shù)據(jù)铺韧,如果在需要輸入的文本前面先輸一個(gè)英文的單引號(hào) “ ' ” 字符多矮,就默認(rèn)成文本格式了,上述問題即可解決哈打。這也是區(qū)分?jǐn)?shù)字單元格是數(shù)值還是文本的標(biāo)識(shí)塔逃。