此篇文章旨在將原來(lái)所記的紙質(zhì)筆記謄寫到網(wǎng)頁(yè)上,便于留存與查看寨腔,并找到了原書的電子版,增加了一些插圖以便于理解每界,電子版鏈接已置于文末命咐,如覺(jué)得不太清晰的但又覺(jué)得很有料的可購(gòu)買紙質(zhì)書進(jìn)行查閱伊佃,個(gè)人覺(jué)得這本書是份不錯(cuò)干貨沛善。
1.數(shù)據(jù)分析
(1)何謂數(shù)據(jù)分析:
- 數(shù)據(jù)分析是指用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)收集來(lái)大量數(shù)據(jù)進(jìn)行分析,將它們加以匯總和理解消化帅涂,以求最大化地開(kāi)發(fā)數(shù)據(jù)的功能媳友,發(fā)揮數(shù)據(jù)的作用
- 數(shù)據(jù)分析是為了提取有用信息和形成結(jié)論而對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過(guò)程
(2)數(shù)據(jù)分析的三大作用: - 現(xiàn)狀分析
- 原因分析
- 預(yù)測(cè)分析
(3)數(shù)據(jù)分析六部曲
(I)明確分析目的和思路
(II)數(shù)據(jù)收集
(III)數(shù)據(jù)處理
(IV)數(shù)據(jù)分析
(V)數(shù)據(jù)展現(xiàn)
(VI)報(bào)告撰寫
(4)分析理論
(I) 營(yíng)銷方面的理論模型:4P产捞、用戶使用行為坯临、STP理論、SWOT等 -
4P營(yíng)銷理論:主要用于公司整體經(jīng)營(yíng)情況分析
Product:產(chǎn)品
Price:價(jià)格
Place:渠道
Promotion:促銷
-
用戶行為理論:用于研究用戶行為
認(rèn)知 -- 熟悉 -- 試用 -- 使用 -- 忠誠(chéng)
(II) 管理方面的理論模型:PEST、5W2H睬魂、時(shí)間管理、生命周期空幻、邏輯樹(shù)约郁、金字塔鬓梅、SMART原則等
- PEST分析法:主要用于行業(yè)分析
Political:政治環(huán)境
Economic:經(jīng)濟(jì)環(huán)境
Social:社會(huì)環(huán)境
Technological:技術(shù)環(huán)境 -
5W2H分析法 :可用于用戶行為、業(yè)務(wù)專題分析等
-
邏輯樹(shù)分析法:可用于業(yè)務(wù)問(wèn)題專題分析
(5)數(shù)據(jù)分析師的要求:
- 懂業(yè)務(wù)
- 懂管理
- 懂分析
- 懂工具
- 懂設(shè)計(jì)
(6)常用的幾個(gè)指標(biāo)和術(shù)語(yǔ) - 平均數(shù):算術(shù)平均數(shù)/調(diào)和平均數(shù)/幾何平均數(shù)
- 絕對(duì)數(shù)與相對(duì)數(shù)
絕對(duì)數(shù):是反映客觀現(xiàn)象總體在一定的時(shí)間活孩、地點(diǎn)條件下的總規(guī)模憾儒、總水平的總和指標(biāo),比如GDP阳掐、總?cè)丝诘龋?br> 相對(duì)數(shù):比較數(shù)值(比數(shù))/ 基礎(chǔ)數(shù)值(基數(shù)) - 百分?jǐn)?shù)與百分點(diǎn)
- 頻數(shù)與頻率
- 倍數(shù)與番數(shù)
倍數(shù)是一個(gè)數(shù)除以另一個(gè)數(shù)所得的商,比如A/B=C,就說(shuō)A是B的C倍;
番數(shù)是指原來(lái)數(shù)量的2的N次方倍艺骂。比如翻一番為原來(lái)數(shù)量的2倍(21),翻兩番為原來(lái)的4倍(22) - 同比與環(huán)比
同比是指與歷史同期數(shù)據(jù)相比得到的值钳恕,比如2012-09/2011-09
環(huán)比是指與前一個(gè)統(tǒng)計(jì)期進(jìn)行比較得到的值,比如2012-09/2012-08
2.字段:是事物或現(xiàn)象的某種特征
記錄:是事物或現(xiàn)象的具體表現(xiàn)睦番,也稱為數(shù)據(jù)或變量值
3.數(shù)據(jù)類型:(1)字符型數(shù)據(jù) ;(2)數(shù)值型數(shù)據(jù)
4.數(shù)據(jù)表:(1)一維表 托嚣;(2)二維表 巩检;(3)二維表轉(zhuǎn)一維表 P54
5.導(dǎo)入數(shù)據(jù):(1)導(dǎo)入文本數(shù)據(jù) P58 ; (2)自動(dòng)導(dǎo)入網(wǎng)站數(shù)據(jù) P60
6.問(wèn)卷錄入要求:(1)單選題示启;(2)數(shù)值題兢哭;(3)多選題;(4)排序題;(5)開(kāi)放性文字題 P64
7.“三心二意”處理數(shù)據(jù):信心郑诺、細(xì)心轻抱、平常心、誠(chéng)意、合意
8.數(shù)據(jù)清洗:
(1)重復(fù)數(shù)據(jù)的處理:
① 函數(shù)法(excel):counif(數(shù)據(jù)范圍,計(jì)算條件)
② 高級(jí)篩選法(excel):(I)選擇單元格區(qū)域颈嚼;(II)數(shù)據(jù) -- 排序和篩選 -- 高級(jí) 佩研;(III)選擇“將篩選結(jié)果復(fù)制到其他位置”绊序,勾選“選擇不重復(fù)記錄”;
③ 條件格式法(excel):開(kāi)始 -- 條件格式 --突出顯示單元格規(guī)則 -- 重復(fù)值
④ 數(shù)據(jù)透視法
⑤ 刪除重復(fù)數(shù)據(jù):
方法一:選擇數(shù)據(jù)區(qū)域 -- 數(shù)據(jù) -- 數(shù)據(jù)工作 -- 刪除重復(fù)值
方法二:(I)counif法;(II)篩選 計(jì)數(shù)列 不等于1的數(shù)值
(2)缺失值的處理:
① 定位輸入:【開(kāi)始 -- 編輯 -- 定位條件】/ 【 Ctrl +G -- 定位條件 】 -- 空值 -- 確定
(I)處理缺失值的四種方法:
方法一:用一個(gè)樣本統(tǒng)計(jì)量(比如平均數(shù)、中位數(shù)等)代替缺失值
方法二:用一個(gè)統(tǒng)計(jì)模型計(jì)算出來(lái)的值去代替缺失值
方法三:將有缺失值的記錄刪除衣撬,不過(guò)可能會(huì)導(dǎo)致樣本量的減少
方法四:將有缺失值的記錄保留靠粪,僅在相應(yīng)的分析中做必要的刪除
② "Ctrl + Enter"快捷鍵
③ 查找替換:
查找功能的快捷鍵 :Ctrl + F
替換功能的快捷鍵 :Ctrl +H
(3)檢查數(shù)據(jù)邏輯錯(cuò)誤
① 利用IF函數(shù)檢查錯(cuò)誤 :IF(logical_test,value_if_ture,value_if_false)
② 利用條件格式標(biāo)記錯(cuò)誤:選中數(shù)據(jù)區(qū)域 -- 開(kāi)始 -- 條件格式 -- 突出顯示單元格規(guī)則 -- 其它規(guī)則 -- 使用公式確定要設(shè)置格式的單元格 -- 在“為符合此公式的值設(shè)置格式”文本框中輸入“公式” -- 格式
OR(logical1,logical2,...):至少一個(gè)參數(shù)為真君仆,就返回TRUE
AND(logical1,logical2,...):所有參數(shù)全部為真评姨,才返回TRUE
9.數(shù)據(jù)加工
(1)數(shù)據(jù)抽揉率唷:是指保留原數(shù)據(jù)表中某些字段的部分信息择葡,組成一個(gè)新的字段 妥箕。
可以是:
① 截取某一字段的部分信息 -- 字段分列
② 將某幾個(gè)字段合并為一個(gè)新字段 -- 字段合并
③ 將原數(shù)據(jù)表沒(méi)有而其他數(shù)據(jù)表中有的字段有效的匹配過(guò)來(lái) -- 字段匹配
-
字段分列
(I)菜單法:選擇要轉(zhuǎn)換的數(shù)據(jù)區(qū)域,在“數(shù)據(jù)”選項(xiàng)卡的“數(shù)據(jù)工具”組中,單擊“分列”按鈕 -- “文本分列想到--第1步”中單擊“分隔符號(hào)” -- “文本分列向?qū)?-第2步”中根據(jù)需要選擇分隔符號(hào)
(II)函數(shù)法:
LEFT(text,num_chars):得到字符串左部指定個(gè)數(shù)的字符串
RUGHT(text,num_chars):得到字符串右部指定個(gè)數(shù)的字符
-
字段合并
公式 | 結(jié)果 |
---|---|
=A2&"遲到"&B2&"次" | 小白遲到5次 |
=A3&"遲到比例為"&TEXT(B3,"0%") | 小白遲到的比例為10% |
=CONCATENATE(A2,"遲到",B2,"次") | 小白遲到5次 |
函數(shù)TEXT()的作用是在使用連接運(yùn)算符連接數(shù)字與文本時(shí)您机,控制數(shù)字的顯示方式
-
字段匹配
VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)
(2)數(shù)據(jù)計(jì)算
①簡(jiǎn)單計(jì)算:+,-,*,/
②函數(shù)計(jì)算:
(I)平均值與綜合:AVERAGE(),SUM()
(II)日期函數(shù):
DATE()
YEAR()
MONTH()
DAY()
(III)用函數(shù)DATEDIF()計(jì)算工齡
DATEDIF(start_date,end_date,unit) :返回兩個(gè)日期之間的年/月/日間隔數(shù)
unit有Y/M/D/MD/YM/YD六種形式:
"Y"指時(shí)間段中的整年數(shù)挑社,"M"為整月數(shù),"D"為整天數(shù)
"MD"為天數(shù)的差捌木,忽略日期中的月和年
"YM"為月數(shù)的差极舔,忽略日期中 的日和年
"YD"為天數(shù)的差拥峦,忽略日期中的年
(3)數(shù)據(jù)分組:VLOOKUP(A2,$D$2:$E$12,2)
(4)數(shù)據(jù)轉(zhuǎn)換:
① 數(shù)據(jù)表的行列互換:
【選擇性粘貼 -- 轉(zhuǎn)置 】/ Ctrl + Alt + V
10.數(shù)據(jù)抽樣
(1)普查
(2)抽樣調(diào)查
RAND()函數(shù):返回[0,1]的均勻分布隨機(jī)數(shù)羽利,而且每次計(jì)算工作表時(shí)都將 返回一個(gè)新的數(shù)值匾浪。
a,b代表兩個(gè)數(shù)字,a<b,若要生成a與b之間的隨機(jī)實(shí)數(shù)眠砾,可以使用公式:
=RAND()*(b-a)+a
11.數(shù)據(jù)分析方法
(1)對(duì)比分析法
①定義:所謂對(duì)比分析法,是將兩個(gè)或兩個(gè)以上的數(shù)據(jù)進(jìn)行比較,分析他們的差異,從而揭示這些數(shù)據(jù)所代表的事物發(fā)展變化情況和規(guī)律性劲藐。
②特點(diǎn):可以非常直觀地看出事物某方面的變化或差距,并且可以準(zhǔn)確、量化地表示出這種變化或差距是多少饭望。
③分類:
(I)靜態(tài)比較是在同一時(shí)間條件下對(duì)不同總體指標(biāo)的比較苇倡,也叫橫向比較,簡(jiǎn)稱橫比。
(II)動(dòng)態(tài)比較是在同一總體條件下對(duì)不同時(shí)期指標(biāo)數(shù)值的比較阔拳,也叫縱向比較嗤形,簡(jiǎn)稱縱比。
④實(shí)踐運(yùn)用
(I)與目標(biāo)對(duì)比
(II)不同時(shí)期對(duì)比(同比船庇,環(huán)比)
(III)同級(jí)部門 邑蒋、單位造虏、地區(qū)對(duì)比
(IV)行業(yè)內(nèi)對(duì)比
(V)活動(dòng)效果對(duì)比
⑤注意事項(xiàng)
(I)指標(biāo)的口徑范圍、計(jì)算方法狐肢、計(jì)量單位必須一致鲤孵,即要用同一種單位或標(biāo)準(zhǔn)去衡量
(II)對(duì)比的對(duì)象要有可比性
(III)對(duì)比的指標(biāo)類型必須一致
(2)分組分析法
根據(jù)數(shù)據(jù)分析對(duì)象的特征漆际,按照一定的標(biāo)志(指標(biāo)),把數(shù)據(jù)分析對(duì)象劃分為不同的部分和類型 來(lái)進(jìn)行研究塘雳,以揭示其內(nèi)部的聯(lián)系和規(guī)律性酸员。
(3)結(jié)構(gòu)分析法
結(jié)構(gòu)分析法是指被分析總體內(nèi)各部分與總體之間進(jìn)行對(duì)比的分析方法,即總體內(nèi)各部分占總體的比例屁置,屬于相對(duì)指標(biāo)。
公式:結(jié)構(gòu)相對(duì)指標(biāo)(比例) = (總體某部分的數(shù)值 / 總體總量)* 100%
應(yīng)用:市場(chǎng)占有率 = (某種商品銷售量 / 該種商品市場(chǎng)銷售總額)* 100%
(4)平均分析法
平均分析法就是運(yùn)用計(jì)算平均數(shù)的方法來(lái)反映總體在一定時(shí)間裁厅、地點(diǎn)條件下某一特征的一般水平。
(5)交叉分析法
(6)綜合評(píng)價(jià)分析法
①標(biāo)準(zhǔn)化數(shù)據(jù)方法:0-1標(biāo)準(zhǔn)化也叫離差標(biāo)準(zhǔn)化
公式:第N個(gè)經(jīng)標(biāo)準(zhǔn)化處理的值=(第N個(gè)原始值-最小值)/ (最大值-最小值)
②權(quán)重確定方法
(7)杜邦分析法
(8)漏斗圖分析法
(9)矩陣關(guān)聯(lián)分析法
① 矩陣
② 發(fā)展矩陣
③ 改進(jìn)難易矩陣
④ 舉一反三
(10)高級(jí)數(shù)據(jù)分析方法
- 可能是因?yàn)槭S嗳率顷P(guān)于圖表制作以及數(shù)據(jù)報(bào)告的制作,圖文結(jié)合看比較好鳄梅,故未作筆記
- 文中標(biāo)記頁(yè)碼的應(yīng)該是篇幅比較長(zhǎng)
- 所以這里附上電子版書籍,以供查閱
鏈接:《誰(shuí)說(shuō)菜鳥不會(huì)數(shù)據(jù)分析》
提取碼:769q