Reference:excel技巧篇
本次講解依然是提綱,圖文部分引用自百度經(jīng)驗别瞭。如果有疑問或建議懂算,可以留言給我只冻,也可以網(wǎng)上搜索。內(nèi)容方面照舊會補(bǔ)充SQL和Python计技。
快捷鍵
Excel的快捷鍵很多喜德,以下主要是能提高效率。
Ctrl+方向鍵酸役,對單元格光標(biāo)快速移動住诸,移動到數(shù)據(jù)邊緣(空格位置)。
Ctrl+Shift+方向鍵涣澡,對單元格快讀框選贱呐,選擇到數(shù)據(jù)邊緣(空格位置)。
Ctrl+空格鍵入桂,選定整列奄薇。
Shift+空格鍵,選定整行抗愁。
Ctrl+A馁蒂,選擇整張表呵晚。
Alt+Enter,換行沫屡。
Ctrl+Enter饵隙,以當(dāng)前單元格為始,往下填充數(shù)據(jù)和函數(shù)沮脖。
Ctrl+S金矛,快讀保存,你懂的勺届。
Ctrl+Z驶俊,撤回當(dāng)前操作。
如果是效率達(dá)人免姿,可以學(xué)習(xí)更多快捷鍵饼酿。Mac用戶的Ctrl一般需要用command替換。
格式轉(zhuǎn)換
Excel的格式及轉(zhuǎn)換很容易忽略胚膊,但格式會如影隨形伴隨數(shù)據(jù)分析者的一切場景故俐,是后續(xù)SQL和Python數(shù)據(jù)類型的基礎(chǔ)。
通常我們將Excel格式分為數(shù)值澜掩、文本购披、時間。
數(shù)值常見整數(shù)型 Int和小數(shù)/浮點型 Float肩榕。兩者的界限很模糊刚陡。在SQL和Python中,則會牽扯的復(fù)雜株汉,涉及運(yùn)算效率筐乳,計算精度等。
文本分為中文和英文乔妈,存儲字節(jié)蝙云,字符長度不同。中文很容易遇到編碼問題路召,尤其是Python2勃刨。Win和Mac環(huán)境也有差異。大家遇到的亂碼一般都屬于中文編碼錯誤股淡。
時間格式在Excel中可以和數(shù)值直接互換身隐,也能用加減法進(jìn)行天數(shù)換算。
時間格式有不同表達(dá)唯灵。例如2016年11月11日贾铝,2016/11/11,2016-11-11等。當(dāng)數(shù)據(jù)源多就會變得混亂垢揩。我們可以用自定義格式規(guī)范時間玖绿。
這里了解一下時間格式的概念,列舉是一些較通用的范例(不同編程語言還是有差異的)叁巨。
YYYY代表通配的四位數(shù)年格式
MM代表通配的兩位數(shù)月格式
DD代表通配的兩位數(shù)日格式
HH代表通配的的兩位數(shù)小時(24小時)格式
hh代表通配的兩位數(shù)邪叻恕(12小時制)格式
mm代表通配的兩位數(shù)分格式
ss代表通配的兩位數(shù)秒格式
例如2016/11/11可以寫成:yyyy/MM/dd
2016-11-11 23:59:59可以寫成:yyyy-MM-dd HH:mm:ss
數(shù)組 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ???百度經(jīng)驗:excel--數(shù)組
數(shù)組很多人都不會用到俘种,甚至不知道有這個功能。依舊是數(shù)據(jù)分析越往后用到越多,它類似R語言的Array和Python的List布近。
數(shù)組由多個元素組成。普通函數(shù)的計算結(jié)果是一個值预伺,數(shù)組類函數(shù)的計算結(jié)果返回多個值。
數(shù)組用大括號表示瞒御,當(dāng)函數(shù)中使用到數(shù)組,應(yīng)該用Ctrl+Shift+Enter輸入蜻懦,不然會報錯。
先看數(shù)組的最基礎(chǔ)使用乔煞。選擇A1:D1區(qū)域,輸入={1,2,3,4}空骚。記住是大括號。然后Ctrl+Shift+Enter。我們發(fā)現(xiàn)數(shù)組里的四個值被分別傳到四個單元格中智厌,這是數(shù)組的獨有用法。
我們再來看一下數(shù)組和函數(shù)的應(yīng)用。利用{}惨险,我們能做到1匹配a,2匹配b恭朗,3匹配c。也就是一一對應(yīng)棍丐。專業(yè)說法是Mapping。
=lookup(查找值,{1,2,3}阱高,{"a","b","c"})
Excel的數(shù)組具體應(yīng)用,大家可以搜索學(xué)習(xí),可以提高一定的效率厂置。但是Python的數(shù)組更為強(qiáng)大智绸,我的重點就不放在這塊了。
分列 ? ? ? ? ? ? ? ? ? ? ?百度經(jīng)驗:excel_分列
Excel可以將多個單元格的內(nèi)容合并卧斟,但是不擅長拆分。分列功能可以將某一列按照特定規(guī)則拆分。常常用來進(jìn)行數(shù)據(jù)清洗饿幅。
上文我有一列地區(qū)的數(shù)據(jù)洪燥,我想要將市和區(qū)分成兩列。我們可以用mid和find函數(shù)查找市截取字符捧韵。但最快的做法就是用“市”分列市咆。
出一個思考題,如果市和自治區(qū)區(qū)都存在應(yīng)該如何分列再来?
SQL和Python中有類似的spilt ( )函數(shù)蒙兰。
合并單元個格
單元格作為報表整理使用,除非是最終輸出格式芒篷,例如打印搜变。否則不要隨意合并單元格。
一旦使用合并單元格针炉,絕大多數(shù)函數(shù)都不能正常使用挠他,影響批量的數(shù)據(jù)處理和格式轉(zhuǎn)換。合并單元格也會造成Python和SQL的讀取錯誤篡帕。
數(shù)據(jù)透視表 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 百度經(jīng)驗: ?excel_數(shù)據(jù)透視表
數(shù)據(jù)透視表是非常強(qiáng)大的功能殖侵,當(dāng)初學(xué)會時驚為天人。
數(shù)據(jù)透視表的主要功能是將數(shù)據(jù)聚合镰烧,按照各子段進(jìn)行sum( )拢军,count( )的運(yùn)算。
下圖我選擇我選擇想要計算的數(shù)據(jù)怔鳖,然后點擊創(chuàng)建透視表茉唉。
此時會新建一個Sheet,這是數(shù)據(jù)透視表的優(yōu)點败砂,將原始數(shù)據(jù)和匯總計算數(shù)據(jù)分離赌渣。
數(shù)據(jù)透視表的核心思想是聚合運(yùn)算,將字段名相同的數(shù)據(jù)聚合起來昌犹,所謂數(shù)以類分坚芜。
列和行的設(shè)置,則是按不同軸向展現(xiàn)數(shù)據(jù)斜姥。簡單說鸿竖,你想要什么結(jié)構(gòu)的報表沧竟,就用什么樣的拖拽方式。
聚合功能有一點類似SQL中的gorup by缚忧,python中則有更為強(qiáng)大的pandas.pivot_table( )悟泵。
刪除重復(fù)項 ? ? ? ? ? ? ? ? ? ? ?百度經(jīng)驗:excel_刪除重復(fù)項
一種數(shù)據(jù)清洗和檢驗的快速方式。想要驗證某一列有多少個唯一值闪水,或者數(shù)據(jù)清洗糕非,都可以使用。
類似SQL中的distinct ,python中的set
條件格式 ? ? ? ? ? ? ? ? ? ? ? ? 百度經(jīng)驗:excel_條件格式
條件格式可以當(dāng)作數(shù)據(jù)可視化的應(yīng)用球榆。如果我們要使用函數(shù)在大量數(shù)據(jù)中找出前三的值朽肥,可能會用到rank( )函數(shù),排序持钉,然后過濾出1衡招,2,3每强。
用條件格式則是另外一種快速方法始腾,直接用顏色標(biāo)出,非常直觀空执。
凍結(jié)首行首列 ? ? ? ? ? ? ? ? ? ? 百度經(jīng)驗:excel_凍結(jié)行首列
Excel的首行一般是各字段名Header浪箭,俗稱表頭,當(dāng)行數(shù)和列數(shù)過多的時候脆烟,觀察數(shù)據(jù)比較麻煩山林。我們可以通過固定住首行,方便瀏覽和操作邢羔。
Header是一個較為重要的概念。在Python和R中桑孩,read_csv函數(shù)拜鹤,會有一個專門的參數(shù)header=true,來判斷是否讀取表頭作為columns的名字流椒。
自定義下拉菜單(數(shù)據(jù)有效性) ?百度經(jīng)驗:excel_自定義下拉菜單
數(shù)據(jù)有效性是一種約束敏簿,針對單元格限制其輸入,也就是讓其只能固定幾個值宣虾。下拉菜單是一種高階應(yīng)用惯裕,通過允許下拉箭頭即可。
自定義名稱 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 百度經(jīng)驗:excel_自定義名稱
自定義名稱是一個很好用的技巧绣硝,我們可以為一個區(qū)域蜻势,變量、或者數(shù)組定義一個名稱鹉胖。后續(xù)要經(jīng)常使用的話握玛,直接引用即可够傍,無需再次定位。這是復(fù)用的概念挠铲。
我們將A1:A3區(qū)域命名為NUM
直接使用=sum(NUM) 冕屯,等價于sum(A1:A3)。
新手們理解數(shù)據(jù)庫拂苹,可以將其想象成無數(shù)張表sheet安聘。每一張表都有自己唯一的名字,就像上圖的NUM一樣瓢棒。數(shù)據(jù)庫操作就是引用表名進(jìn)行查找浴韭、關(guān)聯(lián)等操作。使用sum音羞,count等函數(shù)囱桨。
查找公式錯誤 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?百度經(jīng)驗:?excel_錯誤檢查與追蹤
公式報錯也不知道錯在哪里的時候可以使用,尤其是各類IF嵌套或者多表關(guān)聯(lián)嗅绰,邏輯復(fù)雜時舍肠。查找公式錯誤是逐步運(yùn)算的,方便定位窘面。
分組和分級顯示 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 百度經(jīng)驗:excel分組顯示
分組和分級顯示翠语,常用在報表中,在報表行數(shù)多到一定程度時财边,通過分組達(dá)到快速切換和隱藏的目的肌括。越是專業(yè)度的報表(咨詢、財務(wù)等)酣难,越可以學(xué)習(xí)這塊谍夭。在數(shù)據(jù)菜單下。
分析工具庫 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 百度經(jīng)驗:excel-分析工具庫
分析工具庫是高階分析的利器憨募,包含很多統(tǒng)計計算紧索,檢驗功能等工具。Excel是默認(rèn)不安裝的菜谣,要安裝需要加載項珠漂,在工具菜單下(不同版本安裝方式會有一點小差異)。
分析工具庫是統(tǒng)計包尾膊,規(guī)劃求解是計算最優(yōu)解媳危,類似決策樹。這兩者的分析方法以后詳細(xì)論述冈敛。
Mac似乎有閹割待笑。
第三方應(yīng)用 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 百度經(jīng)驗:excel如何下載應(yīng)用商店中的軟件
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??excel應(yīng)用商店中的軟件推薦via知乎
Excel是支持第三方插件的,第三方插件擁有非常強(qiáng)大的功能莺债。甚至完成BI的工作滋觉。
應(yīng)用商店里微軟的Power系列都挺好的签夭。下圖就是Power Map
第三方應(yīng)用商店Mac沒有,非匙迪溃可惜第租。Win用戶請用最新版本,老版本是沒有插件的我纪。
PS.2010版本是沒有的慎宾,2013版本及以上才有應(yīng)用商店。