《誰(shuí)說(shuō)菜鳥不會(huì)數(shù)據(jù)分析》筆記

《誰(shuí)說(shuō)菜鳥不會(huì)數(shù)據(jù)分析》

此篇文章旨在將原來(lái)所記的紙質(zhì)筆記謄寫到網(wǎng)頁(yè)上,便于留存與查看寨腔,并找到了原書的電子版,增加了一些插圖以便于理解每界,電子版鏈接已置于文末命咐,如覺(jué)得不太清晰的但又覺(jué)得很有料的可購(gòu)買紙質(zhì)書進(jìn)行查閱伊佃,個(gè)人覺(jué)得這本書是份不錯(cuò)干貨沛善。


1.數(shù)據(jù)分析
(1)何謂數(shù)據(jù)分析:

  • 數(shù)據(jù)分析是指用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)收集來(lái)大量數(shù)據(jù)進(jìn)行分析,將它們加以匯總和理解消化帅涂,以求最大化地開(kāi)發(fā)數(shù)據(jù)的功能媳友,發(fā)揮數(shù)據(jù)的作用
  • 數(shù)據(jù)分析是為了提取有用信息和形成結(jié)論而對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過(guò)程
    (2)數(shù)據(jù)分析的三大作用:
  • 現(xiàn)狀分析
  • 原因分析
  • 預(yù)測(cè)分析
    (3)數(shù)據(jù)分析六部曲
    (I)明確分析目的和思路
    (II)數(shù)據(jù)收集
    (III)數(shù)據(jù)處理
    (IV)數(shù)據(jù)分析
    (V)數(shù)據(jù)展現(xiàn)
    (VI)報(bào)告撰寫
    (4)分析理論
    (I) 營(yíng)銷方面的理論模型:4P产捞、用戶使用行為坯临、STP理論、SWOT等
  • 4P營(yíng)銷理論:主要用于公司整體經(jīng)營(yíng)情況分析
    Product:產(chǎn)品
    Price:價(jià)格
    Place:渠道
    Promotion:促銷


    4P營(yíng)銷理論在公司業(yè)務(wù)分析中的應(yīng)用
  • 用戶行為理論:用于研究用戶行為
    認(rèn)知 -- 熟悉 -- 試用 -- 使用 -- 忠誠(chéng)


    用戶使用行為理論在網(wǎng)站分析中的應(yīng)用

(II) 管理方面的理論模型:PEST、5W2H睬魂、時(shí)間管理、生命周期空幻、邏輯樹(shù)约郁、金字塔鬓梅、SMART原則等

  • PEST分析法:主要用于行業(yè)分析
    Political:政治環(huán)境
    Economic:經(jīng)濟(jì)環(huán)境
    Social:社會(huì)環(huán)境
    Technological:技術(shù)環(huán)境
  • 5W2H分析法 :可用于用戶行為、業(yè)務(wù)專題分析等


    5W2H分析法在用戶購(gòu)買行為上的應(yīng)用
  • 邏輯樹(shù)分析法:可用于業(yè)務(wù)問(wèn)題專題分析


    邏輯樹(shù)分析法在利潤(rùn)分析中的使用

(5)數(shù)據(jù)分析師的要求:

  • 懂業(yè)務(wù)
  • 懂管理
  • 懂分析
  • 懂工具
  • 懂設(shè)計(jì)
    (6)常用的幾個(gè)指標(biāo)和術(shù)語(yǔ)
  • 平均數(shù):算術(shù)平均數(shù)/調(diào)和平均數(shù)/幾何平均數(shù)
  • 絕對(duì)數(shù)與相對(duì)數(shù)
    絕對(duì)數(shù):是反映客觀現(xiàn)象總體在一定的時(shí)間活孩、地點(diǎn)條件下的總規(guī)模憾儒、總水平的總和指標(biāo),比如GDP阳掐、總?cè)丝诘龋?br> 相對(duì)數(shù):比較數(shù)值(比數(shù))/ 基礎(chǔ)數(shù)值(基數(shù))
  • 百分?jǐn)?shù)與百分點(diǎn)
  • 頻數(shù)與頻率
  • 倍數(shù)與番數(shù)
    倍數(shù)是一個(gè)數(shù)除以另一個(gè)數(shù)所得的商,比如A/B=C,就說(shuō)A是B的C倍;
    番數(shù)是指原來(lái)數(shù)量的2的N次方倍艺骂。比如翻一番為原來(lái)數(shù)量的2倍(21),翻兩番為原來(lái)的4倍(22
  • 同比與環(huán)比
    同比是指與歷史同期數(shù)據(jù)相比得到的值钳恕,比如2012-09/2011-09
    環(huán)比是指與前一個(gè)統(tǒng)計(jì)期進(jìn)行比較得到的值,比如2012-09/2012-08

2.字段:是事物或現(xiàn)象的某種特征
記錄:是事物或現(xiàn)象的具體表現(xiàn)睦番,也稱為數(shù)據(jù)或變量值

3.數(shù)據(jù)類型:(1)字符型數(shù)據(jù) ;(2)數(shù)值型數(shù)據(jù)

4.數(shù)據(jù)表:(1)一維表 托嚣;(2)二維表 巩检;(3)二維表轉(zhuǎn)一維表 P54

5.導(dǎo)入數(shù)據(jù):(1)導(dǎo)入文本數(shù)據(jù) P58 ; (2)自動(dòng)導(dǎo)入網(wǎng)站數(shù)據(jù) P60

6.問(wèn)卷錄入要求:(1)單選題示启;(2)數(shù)值題兢哭;(3)多選題;(4)排序題;(5)開(kāi)放性文字題 P64

7.“三心二意”處理數(shù)據(jù):信心郑诺、細(xì)心轻抱、平常心、誠(chéng)意、合意

8.數(shù)據(jù)清洗:
(1)重復(fù)數(shù)據(jù)的處理:
① 函數(shù)法(excel):counif(數(shù)據(jù)范圍,計(jì)算條件)
② 高級(jí)篩選法(excel):(I)選擇單元格區(qū)域颈嚼;(II)數(shù)據(jù) -- 排序和篩選 -- 高級(jí) 佩研;(III)選擇“將篩選結(jié)果復(fù)制到其他位置”绊序,勾選“選擇不重復(fù)記錄”;
③ 條件格式法(excel):開(kāi)始 -- 條件格式 --突出顯示單元格規(guī)則 -- 重復(fù)值
④ 數(shù)據(jù)透視法
⑤ 刪除重復(fù)數(shù)據(jù):
方法一:選擇數(shù)據(jù)區(qū)域 -- 數(shù)據(jù) -- 數(shù)據(jù)工作 -- 刪除重復(fù)值
方法二:(I)counif法;(II)篩選 計(jì)數(shù)列 不等于1的數(shù)值
(2)缺失值的處理:
① 定位輸入:【開(kāi)始 -- 編輯 -- 定位條件】/ 【 Ctrl +G -- 定位條件 】 -- 空值 -- 確定
(I)處理缺失值的四種方法:
方法一:用一個(gè)樣本統(tǒng)計(jì)量(比如平均數(shù)、中位數(shù)等)代替缺失值
方法二:用一個(gè)統(tǒng)計(jì)模型計(jì)算出來(lái)的值去代替缺失值
方法三:將有缺失值的記錄刪除衣撬,不過(guò)可能會(huì)導(dǎo)致樣本量的減少
方法四:將有缺失值的記錄保留靠粪,僅在相應(yīng)的分析中做必要的刪除
② "Ctrl + Enter"快捷鍵
③ 查找替換:
查找功能的快捷鍵 :Ctrl + F
替換功能的快捷鍵 :Ctrl +H
(3)檢查數(shù)據(jù)邏輯錯(cuò)誤
① 利用IF函數(shù)檢查錯(cuò)誤 :IF(logical_test,value_if_ture,value_if_false)
② 利用條件格式標(biāo)記錯(cuò)誤:選中數(shù)據(jù)區(qū)域 -- 開(kāi)始 -- 條件格式 -- 突出顯示單元格規(guī)則 -- 其它規(guī)則 -- 使用公式確定要設(shè)置格式的單元格 -- 在“為符合此公式的值設(shè)置格式”文本框中輸入“公式” -- 格式
OR(logical1,logical2,...):至少一個(gè)參數(shù)為真君仆,就返回TRUE
AND(logical1,logical2,...):所有參數(shù)全部為真评姨,才返回TRUE

9.數(shù)據(jù)加工
(1)數(shù)據(jù)抽揉率唷:是指保留原數(shù)據(jù)表中某些字段的部分信息择葡,組成一個(gè)新的字段 妥箕。
可以是:
① 截取某一字段的部分信息 -- 字段分列
② 將某幾個(gè)字段合并為一個(gè)新字段 -- 字段合并
③ 將原數(shù)據(jù)表沒(méi)有而其他數(shù)據(jù)表中有的字段有效的匹配過(guò)來(lái) -- 字段匹配

  • 字段分列

(I)菜單法:選擇要轉(zhuǎn)換的數(shù)據(jù)區(qū)域,在“數(shù)據(jù)”選項(xiàng)卡的“數(shù)據(jù)工具”組中,單擊“分列”按鈕 -- “文本分列想到--第1步”中單擊“分隔符號(hào)” -- “文本分列向?qū)?-第2步”中根據(jù)需要選擇分隔符號(hào)
(II)函數(shù)法:
LEFT(text,num_chars):得到字符串左部指定個(gè)數(shù)的字符串
RUGHT(text,num_chars):得到字符串右部指定個(gè)數(shù)的字符

  • 字段合并
公式 結(jié)果
=A2&"遲到"&B2&"次" 小白遲到5次
=A3&"遲到比例為"&TEXT(B3,"0%") 小白遲到的比例為10%
=CONCATENATE(A2,"遲到",B2,"次") 小白遲到5次

函數(shù)TEXT()的作用是在使用連接運(yùn)算符連接數(shù)字與文本時(shí)您机,控制數(shù)字的顯示方式

  • 字段匹配

VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)


Vlookup()函數(shù)

(2)數(shù)據(jù)計(jì)算
①簡(jiǎn)單計(jì)算:+,-,*,/
②函數(shù)計(jì)算:
(I)平均值與綜合:AVERAGE(),SUM()
(II)日期函數(shù):
DATE()
YEAR()
MONTH()
DAY()
(III)用函數(shù)DATEDIF()計(jì)算工齡
DATEDIF(start_date,end_date,unit) :返回兩個(gè)日期之間的年/月/日間隔數(shù)
unit有Y/M/D/MD/YM/YD六種形式:
"Y"指時(shí)間段中的整年數(shù)挑社,"M"為整月數(shù),"D"為整天數(shù)
"MD"為天數(shù)的差捌木,忽略日期中的月和年
"YM"為月數(shù)的差极舔,忽略日期中 的日和年
"YD"為天數(shù)的差拥峦,忽略日期中的年
(3)數(shù)據(jù)分組:VLOOKUP(A2,$D$2:$E$12,2)


利用vlookup函數(shù)進(jìn)行分組

(4)數(shù)據(jù)轉(zhuǎn)換:
① 數(shù)據(jù)表的行列互換:
【選擇性粘貼 -- 轉(zhuǎn)置 】/ Ctrl + Alt + V

10.數(shù)據(jù)抽樣
(1)普查
(2)抽樣調(diào)查
RAND()函數(shù):返回[0,1]的均勻分布隨機(jī)數(shù)羽利,而且每次計(jì)算工作表時(shí)都將 返回一個(gè)新的數(shù)值匾浪。
a,b代表兩個(gè)數(shù)字,a<b,若要生成a與b之間的隨機(jī)實(shí)數(shù)眠砾,可以使用公式:
=RAND()*(b-a)+a

11.數(shù)據(jù)分析方法
(1)對(duì)比分析法
①定義:所謂對(duì)比分析法,是將兩個(gè)或兩個(gè)以上的數(shù)據(jù)進(jìn)行比較,分析他們的差異,從而揭示這些數(shù)據(jù)所代表的事物發(fā)展變化情況和規(guī)律性劲藐。
②特點(diǎn):可以非常直觀地看出事物某方面的變化或差距,并且可以準(zhǔn)確、量化地表示出這種變化或差距是多少饭望。
③分類:
(I)靜態(tài)比較是在同一時(shí)間條件下對(duì)不同總體指標(biāo)的比較苇倡,也叫橫向比較,簡(jiǎn)稱橫比。
(II)動(dòng)態(tài)比較是在同一總體條件下對(duì)不同時(shí)期指標(biāo)數(shù)值的比較阔拳,也叫縱向比較嗤形,簡(jiǎn)稱縱比。
④實(shí)踐運(yùn)用
(I)與目標(biāo)對(duì)比
(II)不同時(shí)期對(duì)比(同比船庇,環(huán)比)
(III)同級(jí)部門 邑蒋、單位造虏、地區(qū)對(duì)比
(IV)行業(yè)內(nèi)對(duì)比
(V)活動(dòng)效果對(duì)比
⑤注意事項(xiàng)
(I)指標(biāo)的口徑范圍、計(jì)算方法狐肢、計(jì)量單位必須一致鲤孵,即要用同一種單位或標(biāo)準(zhǔn)去衡量
(II)對(duì)比的對(duì)象要有可比性
(III)對(duì)比的指標(biāo)類型必須一致
(2)分組分析法
根據(jù)數(shù)據(jù)分析對(duì)象的特征漆际,按照一定的標(biāo)志(指標(biāo)),把數(shù)據(jù)分析對(duì)象劃分為不同的部分和類型 來(lái)進(jìn)行研究塘雳,以揭示其內(nèi)部的聯(lián)系和規(guī)律性酸员。
(3)結(jié)構(gòu)分析法
結(jié)構(gòu)分析法是指被分析總體內(nèi)各部分與總體之間進(jìn)行對(duì)比的分析方法,即總體內(nèi)各部分占總體的比例屁置,屬于相對(duì)指標(biāo)。
公式:結(jié)構(gòu)相對(duì)指標(biāo)(比例) = (總體某部分的數(shù)值 / 總體總量)* 100%
應(yīng)用:市場(chǎng)占有率 = (某種商品銷售量 / 該種商品市場(chǎng)銷售總額)* 100%
(4)平均分析法
平均分析法就是運(yùn)用計(jì)算平均數(shù)的方法來(lái)反映總體在一定時(shí)間裁厅、地點(diǎn)條件下某一特征的一般水平。
(5)交叉分析法
(6)綜合評(píng)價(jià)分析法


綜合分析法的5個(gè)步驟

①標(biāo)準(zhǔn)化數(shù)據(jù)方法:0-1標(biāo)準(zhǔn)化也叫離差標(biāo)準(zhǔn)化
公式:第N個(gè)經(jīng)標(biāo)準(zhǔn)化處理的值=(第N個(gè)原始值-最小值)/ (最大值-最小值)
②權(quán)重確定方法
(7)杜邦分析法


杜邦分析體系示例

市場(chǎng)占有率杜邦分析體系

(8)漏斗圖分析法


網(wǎng)站轉(zhuǎn)化率(漏斗圖)

(9)矩陣關(guān)聯(lián)分析法
① 矩陣


矩陣示例

② 發(fā)展矩陣


發(fā)展矩陣示例

③ 改進(jìn)難易矩陣


改進(jìn)難易矩陣示例

④ 舉一反三


某公司產(chǎn)品矩陣示例

(10)高級(jí)數(shù)據(jù)分析方法


高級(jí)數(shù)據(jù)分析方法索引表

  • 可能是因?yàn)槭S嗳率顷P(guān)于圖表制作以及數(shù)據(jù)報(bào)告的制作,圖文結(jié)合看比較好鳄梅,故未作筆記
  • 文中標(biāo)記頁(yè)碼的應(yīng)該是篇幅比較長(zhǎng)
  • 所以這里附上電子版書籍,以供查閱
    鏈接:《誰(shuí)說(shuō)菜鳥不會(huì)數(shù)據(jù)分析》
    提取碼:769q
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市岖圈,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌缓待,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,651評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異秕噪,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)漏麦,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,468評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)域蜗,“玉大人,你說(shuō)我怎么就攤上這事巫橄。” “怎么了哥谷?”我有些...
    開(kāi)封第一講書人閱讀 162,931評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我泛烙,道長(zhǎng)踪宠,這世上最難降的妖魔是什么毙驯? 我笑而不...
    開(kāi)封第一講書人閱讀 58,218評(píng)論 1 292
  • 正文 為了忘掉前任鲜结,我火速辦了婚禮纫事,結(jié)果婚禮上侠驯,老公的妹妹穿的比我還像新娘诅福。我一直安慰自己辐啄,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,234評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布秒际。 她就那樣靜靜地躺著,像睡著了一般援雇。 火紅的嫁衣襯著肌膚如雪茴丰。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 51,198評(píng)論 1 299
  • 那天钟病,我揣著相機(jī)與錄音衅金,去河邊找鬼瞒渠。 笑死,一個(gè)胖子當(dāng)著我的面吹牛五辽,可吹牛的內(nèi)容都是我干的悔橄。 我是一名探鬼主播,決...
    沈念sama閱讀 40,084評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼心软,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了削樊?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 38,926評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤蹦玫,失蹤者是張志新(化名)和其女友劉穎挖帘,沒(méi)想到半個(gè)月后抠璃,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體纽甘,經(jīng)...
    沈念sama閱讀 45,341評(píng)論 1 311
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,563評(píng)論 2 333
  • 正文 我和宋清朗相戀三年猾担,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了构挤。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片洒沦。...
    茶點(diǎn)故事閱讀 39,731評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡有送,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出齿风,到底是詐尸還是另有隱情运沦,我是刑警寧澤,帶...
    沈念sama閱讀 35,430評(píng)論 5 343
  • 正文 年R本政府宣布咬扇,位于F島的核電站配乱,受9級(jí)特大地震影響扰她,放射性物質(zhì)發(fā)生泄漏熏挎。R本人自食惡果不足惜猬仁,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,036評(píng)論 3 326
  • 文/蒙蒙 一嗤军、第九天 我趴在偏房一處隱蔽的房頂上張望偿乖。 院中可真熱鬧,春花似錦齐佳、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,676評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)姨蟋。三九已至描融,卻和暖如春补箍,著一層夾襖步出監(jiān)牢的瞬間矮锈,已是汗流浹背射窒。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,829評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工盗冷, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留柑司,地道東北人劲室。 一個(gè)月前我還...
    沈念sama閱讀 47,743評(píng)論 2 368
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像岸浑,于是被迫代替她去往敵國(guó)和親搏存。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,629評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容