一直以來咱們都是拿Power BI說事桩引,但大部分內(nèi)容都是DAX基礎(chǔ)颠悬,可視化元素應(yīng)用,分析模型等為主拷橘。對新手來說毅弧,這些還存在一定門檻
大家知道气嫁,做數(shù)據(jù)分析,都要?dú)v經(jīng)數(shù)據(jù)清洗形真,建模杉编,可視化這三步超全,我們今天要說的咆霜,就是數(shù)據(jù)清洗之前的那些事兒
要做數(shù)據(jù)清洗,首先必須要有數(shù)據(jù)
工作中的數(shù)據(jù)來自兩個(gè)地方
已有的系統(tǒng)(ERP/CRM/考勤/收銀等)中導(dǎo)出的數(shù)據(jù)
Excel里手工輸入的數(shù)據(jù)
系統(tǒng)導(dǎo)出的數(shù)據(jù)規(guī)范整潔嘶朱,清洗過程簡潔輕松
手工數(shù)據(jù)五花八門蛾坯,清洗過程痛不欲生
這里總結(jié)了關(guān)于數(shù)據(jù)錄入的四條規(guī)則
只要遵守規(guī)則,后續(xù)數(shù)據(jù)清洗就沒問題
-----數(shù)據(jù)錄入的四條規(guī)則
規(guī)則一:一個(gè)表單(sheet)里疏遏,只存放一張表格
這似乎是一句正確的廢話脉课,起初我也以為這應(yīng)該是制表共識,不需要解釋财异,直到有一天我看到這樣一張Excel表單
面對如此版面倘零,我曾百思不得騎姐——不便于打印,匯總無從下手戳寸。每次打開文件呈驶,找到需要操作的小表格,都要耗費(fèi)大量時(shí)間疫鹊,因?yàn)檫@張表同時(shí)幾個(gè)人在用…
至于該怎么改袖瞻,參見規(guī)則一內(nèi)容,我怕說多了血壓會升高
規(guī)則二:一個(gè)單元格只對應(yīng)一種數(shù)據(jù)屬性
看下圖(姓名電話均為隨機(jī)生成)拆吆,覺得有什么問題嗎
很多微商或小門店在微信上接單聋迎,都是這樣在紙質(zhì)小本子上手寫的。除了記錄方便枣耀,真的沒有一點(diǎn)優(yōu)勢霉晕。每天收攤結(jié)賬后,低頭瞇眼,拿著計(jì)算器一通摁……拜托娄昆,你以為還是上世紀(jì)佩微?
即便把上面這張單子輸入EXCEL,區(qū)別也不大萌焰,想知道當(dāng)天做了多少金額哺眯,還是離不開計(jì)算器。有人不服氣了“EXCEL不是有匯總函數(shù)嗎扒俯?”那你告訴我奶卓,上面這張單子,三列數(shù)據(jù)匯總哪個(gè)撼玄?
重復(fù)規(guī)則二:一個(gè)單元格只對應(yīng)一種數(shù)據(jù)屬性
比如上圖第二列夺姑,要想輸入Excel,就該拆成三列:物品掌猛、數(shù)量盏浙、單位,如果再加上單價(jià)荔茬,匯總金額自然是唾手可得
其實(shí)废膘,早在電腦辦公普及之前,前輩們就已經(jīng)有現(xiàn)成模板給我們參考了慕蔚∝せ疲看到這些質(zhì)樸的紙質(zhì)單據(jù),是不是很親切
規(guī)則三:相同數(shù)據(jù)填寫要完全一致
此規(guī)則適用于多人制表孔飒,典型表現(xiàn)就是地名灌闺,見下圖
單人制表不存在這個(gè)問題,因?yàn)橥粋€(gè)地名不會出現(xiàn)幾種叫法坏瞄。多人制表則不然桂对,例如N個(gè)銷售員,在記錄各自訂單時(shí)鸠匀,對同一個(gè)地名蕉斜,甚至項(xiàng)目名稱,都會有不同稱呼狮崩,日后做匯總蛛勉,必定增加額外工作量,在數(shù)據(jù)清洗上浪費(fèi)時(shí)間精力
如何解決睦柴?
還記得我們在手機(jī)或網(wǎng)站上注冊時(shí)诽凌,省市信息是如何確定的嗎。是界面自動跳出省市區(qū)縣列表讓我們選擇坦敌,而不是手動輸入侣诵,這樣就避免了人為誤差痢法。在Excel里就是進(jìn)行”數(shù)據(jù)有效性”(EXCEL 2013以下版本)設(shè)置或”數(shù)據(jù)驗(yàn)證”(EXCEL 2013以上版本)。相關(guān)細(xì)節(jié)請自行百度杜顺,網(wǎng)絡(luò)教程汗牛充棟
規(guī)則四:選擇合適的數(shù)據(jù)類型
大家經(jīng)常會遇到數(shù)字無法參與計(jì)算财搁,日期無法提取年月日這種情況,如下圖
▲數(shù)據(jù)類型是文本躬络,即便輸入數(shù)字也無法參與計(jì)算 綠色小三角是其特殊標(biāo)志
▲只有“-”和“/”符號才能被自動識別為日期類型
大家習(xí)以為常的小數(shù)點(diǎn)分隔尖奔,并不能被視為日期,因此無法利用函數(shù)提取信息
碰到文本數(shù)字列穷当,如何批量更正提茁?
利用“數(shù)據(jù)”——“分列”功能即可。選中該列馁菜,點(diǎn)擊“分列”茴扁,一路下一步到底就行
wode
也許看完這篇,對你來說然并L汪疮,該踩的坑照踩不誤
沒關(guān)系峭火,新人成長的必經(jīng)之路