說(shuō)在最前面济蝉,我是一個(gè)不安分的人,一直在各種嘗試,大神勿噴王滤,有建議可以提出贺嫂,謝謝大家的喜歡和不喜歡。本篇沒(méi)有代碼也沒(méi)有模型圖淑仆,關(guān)于本書涝婉,目前不好評(píng)價(jià)哥力,因?yàn)榍八恼潞芎?jiǎn)單蔗怠,感覺(jué)是為后面內(nèi)容做鋪墊,當(dāng)然吩跋,書單還有很多寞射,慢慢的更新。目前職位是前端锌钮,也可以討論前端的問(wèn)題桥温。以上。
一梁丘,數(shù)據(jù)分析引言:分解數(shù)據(jù)
本章主要就是提供解決問(wèn)題的常用思路:
以Acme化妝品公司超前那個(gè)保濕霜銷售需求為例侵浸,期望數(shù)據(jù)分析師幫助提高銷量
開始給出數(shù)據(jù)分析的一般執(zhí)行思路:確定->分解->評(píng)估->決策。
1氛谜,只有更多的了解信息才可以確定問(wèn)題
合理的目標(biāo)銷量掏觉、掌握相關(guān)競(jìng)爭(zhēng)對(duì)手信息,廣告和社交營(yíng)銷預(yù)算
2值漫,把問(wèn)題和數(shù)據(jù)分解
提高銷量:客戶的期望是什么澳腹、哪種是有效的營(yíng)銷方式、廣告的質(zhì)量怎么樣杨何。
對(duì)數(shù)據(jù)因子進(jìn)行分解
根據(jù)表格數(shù)據(jù)進(jìn)行對(duì)比分析
不斷的和客戶進(jìn)行溝通酱塔,了解更多的信息
3,評(píng)估
評(píng)估的目的就是形成自己的判斷危虱,評(píng)估的方式就是進(jìn)行比較優(yōu)化得出一些結(jié)果進(jìn)行匯總
當(dāng)然還要評(píng)估自己的作為數(shù)據(jù)分析師的能力或者說(shuō)是信用問(wèn)題羊娃。
4,決策
評(píng)估就是給出建議埃跷,同時(shí)要保證自己的觀點(diǎn)傳達(dá)到位蕊玷,讓客戶對(duì)你的意見作出正確的決策。
最后:
案例中開始作出調(diào)整廣告的建議捌蚊,但是中間收看到一個(gè)產(chǎn)品針對(duì)少女市場(chǎng)飽和的新聞集畅。那么合理建議一下子被否定了。那么就需要重新開始進(jìn)行確定->分解->評(píng)估->決策缅糟。
最后通過(guò)不斷的分解和假設(shè)到掌握真實(shí)的邊緣信息挺智,深入挖掘市場(chǎng)數(shù)據(jù)得到新的目標(biāo)客戶發(fā)現(xiàn)有男士使用該產(chǎn)品,最后得出推出新男士品牌的決策窗宦,提高銷量達(dá)到客戶要求赦颇。
二二鳄,實(shí)驗(yàn),校驗(yàn)?zāi)愕睦碚?/h2>
本章主要介紹一定要用實(shí)驗(yàn)來(lái)校驗(yàn)自己對(duì)數(shù)據(jù)分析產(chǎn)生的結(jié)論媒怯。
以咖啡咖啡銷量為背景
1订讼,觀察數(shù)據(jù)要考慮到混雜因素,并列舉出來(lái)
選址方便扇苞、咖啡溫度欺殿、員工熱情、咖啡價(jià)值鳖敷、偏愛(ài)去處
2脖苏,拆分?jǐn)?shù)據(jù)塊,管理混雜因素
東安地區(qū)分店定踱、西雅圖區(qū)分店棍潘、SOHO區(qū)分店
3,實(shí)驗(yàn)必須加入實(shí)驗(yàn)組和控制組
為什么要加入控制組崖媚?
因?yàn)樵诘谝淮卧囼?yàn)中亦歉,有降價(jià)和向客戶說(shuō)服咖啡是有價(jià)值的兩條建議,但是實(shí)驗(yàn)只采取了降價(jià)措施畅哑,并沒(méi)有說(shuō)服價(jià)值行動(dòng)肴楷,這樣就會(huì)受到降價(jià)是否有效的質(zhì)疑,所以最終建立了降價(jià)和說(shuō)服兩個(gè)實(shí)驗(yàn)組和一個(gè)默認(rèn)控制組敢课,從而可以進(jìn)行最后的比較阶祭。
故以控制組為基準(zhǔn)才可以證實(shí)實(shí)驗(yàn)對(duì)應(yīng)的假設(shè)條件是否有效。
其中直秆,也講到了隨機(jī)選擇相似組的方法和重要性
最后的整個(gè)流程就是:
將數(shù)據(jù)表劃分為微區(qū)域->將微區(qū)域隨機(jī)分配給控制組和實(shí)驗(yàn)組->進(jìn)行實(shí)驗(yàn)觀察->收集結(jié)果->組與組進(jìn)行相互比較濒募,分析結(jié)果。
三圾结,最優(yōu)化:尋找最大值
本章主要講解如何找出變量因子組合的最大值瑰剃,涉及到了Excel中的solver方法以及基本的線性數(shù)學(xué)知識(shí)。
案例背景:如何生產(chǎn)對(duì)應(yīng)數(shù)量的橡皮魚和橡皮鴨兩種浴盆玩具已得到最大的利潤(rùn)筝野?
1晌姚,變量因子受到的限制條件:
廠家有多少橡膠用來(lái)生產(chǎn)這些產(chǎn)品、廠家生產(chǎn)這兩類產(chǎn)品需要多長(zhǎng)時(shí)間歇竟?
2挥唠,借助目標(biāo)函數(shù)來(lái)發(fā)現(xiàn)目標(biāo)C1X1 + C2X2 =P
C表示約束條件、X表示決策變量焕议、P是你的目標(biāo)
那么C1X1表示橡皮鴨利潤(rùn)宝磨、C2X2表示橡皮魚利潤(rùn),P就是總利潤(rùn)
C可以表示每個(gè)產(chǎn)品的利潤(rùn),X可以表示產(chǎn)品的數(shù)量唤锉,CX就表示總利潤(rùn)了世囊。
3,確定合理的選擇區(qū)
規(guī)定的時(shí)間內(nèi)窿祥,最多只能生產(chǎn)400只橡皮鴨和300條橡皮魚株憾。
根據(jù)橡膠的供應(yīng)量,只能生產(chǎn)500只橡皮鴨晒衩,或者400條橡皮魚嗤瞎。
畫出對(duì)應(yīng)的選擇區(qū)域利用Excel中的Solver工具進(jìn)行求解。
4浸遗,結(jié)果實(shí)際利潤(rùn)中發(fā)現(xiàn)通過(guò)1猫胁,2箱亿,3步驟得出的結(jié)論是錯(cuò)誤的
因?yàn)槟愕哪P椭皇敲枋隽四阋?guī)定的情況跛锌,于是找出歷史數(shù)據(jù)進(jìn)行具體的分析
發(fā)現(xiàn)每個(gè)月的銷售數(shù)量和利潤(rùn)隨著月份在波動(dòng)。
5届惋,堤防負(fù)相關(guān)變量
通過(guò)折線圖可以發(fā)現(xiàn)髓帽,一個(gè)產(chǎn)品越多,另一個(gè)產(chǎn)品就越少脑豹,并且折線圖可以反映每個(gè)月的 波動(dòng)情況郑藏。
于是改變約束條件,即下個(gè)月的銷售數(shù)量的最大值從折線圖來(lái)看不會(huì)超過(guò)多少來(lái)增加限制瘩欺,從而得出最優(yōu)解必盖。最終得出有效的解決方案。
四俱饿,數(shù)據(jù)圖形化歌粥,圖形讓你更精明
本章主要講解是如何讓數(shù)據(jù)圖形化,這里就不是簡(jiǎn)單的利用Excel自帶的一些表格來(lái)繪制圖形拍埠,而是開始講到用R語(yǔ)言來(lái)繪制失驶。
1,數(shù)據(jù)圖形化的根本在于正確比較
2枣购,使用散點(diǎn)圖探索原因
3嬉探,最優(yōu)秀的圖形是多元圖形
4,同時(shí)展示多張圖形棉圈,體現(xiàn)更多變量
總結(jié):
這張主要就是講解要學(xué)會(huì)從大量數(shù)據(jù)中篩選有用的數(shù)據(jù)(不是所有的數(shù)據(jù)都是有效的)涩堤,然后將數(shù)據(jù)圖形化的時(shí)候不是之前章節(jié)簡(jiǎn)單的折線圖或者直方圖或者線性圖,而是離散且多變量圖形的展示分瘾,便開始引出R語(yǔ)言來(lái)將數(shù)據(jù)可視化的概念胎围。而不是簡(jiǎn)單的Excel圖形工具。