《深入淺出數(shù)據(jù)分析》


分析師好比偵探,總有一些秘密等著他們?nèi)グl(fā)現(xiàn),這正是數(shù)據(jù)分析的樂趣所在惠勒。


1. 《深入淺出數(shù)據(jù)分析》

本書的作者是邁克爾·米爾頓(Michael Milton角钩,美國)吝沫,擁有新弗洛里達(dá)學(xué)院哲學(xué)學(xué)位以及耶魯大學(xué)宗教倫理學(xué)位呻澜。他將自己的大半職業(yè)生涯獻(xiàn)給了非營利性機(jī)構(gòu),幫助它們分析和處理從贊助人那里收集來的數(shù)據(jù)惨险,提高融資能力易迹。邁克爾.米爾頓博覽群書,但走出圖書館和書店平道,人們會看到他在跑步睹欲、攝影,以及親手釀制啤酒一屋。

《深入淺出數(shù)據(jù)分析》以類似“章回小說”的活潑形式窘疮,告訴我們?nèi)绾伟l(fā)現(xiàn)和解密數(shù)據(jù)在日常生活中的作用,以及系統(tǒng)化的數(shù)據(jù)分析對制定決策多么有用冀墨。

《深入淺出數(shù)據(jù)分析》

如果下面的問題全部答“對闸衫!”,那么這本書適合你诽嘉!

  • 你認(rèn)為蔚出,數(shù)據(jù)中隱含了無窮的智慧,需要有合適的方法虫腋,來利用這些智慧骄酗,對嗎?
  • 你想學(xué)習(xí)悦冀、理解和記憶如何創(chuàng)建靚麗的圖形趋翻、試驗(yàn)假設(shè)條件、進(jìn)行預(yù)測或整理混亂的數(shù)據(jù)盒蟆,對嗎踏烙?
  • 你喜歡“創(chuàng)意十足、引人入勝的演講”勝于“枯噪历等、無聊的學(xué)術(shù)報(bào)告”讨惩,對嗎?

但寒屯,如果以下問題只要有一個回答“是”荐捻,那么本書與你無緣!

  • 你懼怕嘗試新事物浩螺,寧可用直觀感覺來描述客觀世界靴患,是嗎?
  • 你從未使用過Excel要出,是嗎鸳君?
  • 你是一個經(jīng)驗(yàn)老道的數(shù)據(jù)分析師嗎,正在調(diào)查數(shù)據(jù)分析領(lǐng)域最前沿的課題患蹂,是嗎或颊?

2. 讀書目的

購買砸紊、并閱讀這本書的目的,是想解決如下的問題:

  1. 為什么要學(xué)習(xí)數(shù)據(jù)分析囱挑?
  2. 數(shù)據(jù)分析的基本步驟是什么醉顽?
  3. 如何檢驗(yàn)數(shù)據(jù)分析成果的正確性?
  4. 關(guān)于最優(yōu)化平挑,有何啟發(fā)游添?
  5. 什么是假設(shè)檢驗(yàn)?
  6. 什么是貝葉斯統(tǒng)計(jì)通熄?
  7. 什么是主觀概率唆涝?
  8. 什么是啟發(fā)法?
  9. 什么是回歸預(yù)測唇辨?
  10. 如何解釋和管理誤差廊酣?
  11. 有哪些圖形化展示數(shù)據(jù)的技巧?

3. 讀書筆記

3.1 為什么要學(xué)習(xí)數(shù)據(jù)分析赏枚?

數(shù)據(jù)無處不在亡驰,這已經(jīng)是不爭的事實(shí)。除此之外饿幅,我在公司從事IT工作還有一些切身體會:

  1. 數(shù)據(jù)量越來越大凡辱。2000年時,上網(wǎng)速度是KB算的诫睬,一個典型的應(yīng)用服務(wù)其數(shù)據(jù)庫是按GB算的煞茫。而現(xiàn)在帕涌,上網(wǎng)速度是按GB算的摄凡,典型應(yīng)用服務(wù)的數(shù)據(jù)量最小單位都是TB。
  2. 數(shù)據(jù)類型越來越豐富蚓曼。公司業(yè)務(wù)橫向拓展亲澡、縱向細(xì)分,帶來了豐富多樣的數(shù)據(jù)類型纫版。

如今床绪,不管學(xué)沒學(xué)過數(shù)據(jù)分析,很多崗位在日常工作中都要分析數(shù)據(jù)其弊、得到?jīng)Q策癞己。我想,掌握一些數(shù)據(jù)分析技能梭伐,從而知道:

  • 如何處理所有的數(shù)據(jù)材料痹雅;
  • 如何分解和構(gòu)建復(fù)雜的問題和數(shù)據(jù)集;
  • 如何將原始數(shù)據(jù)轉(zhuǎn)變成推進(jìn)現(xiàn)實(shí)工作的妙策糊识。

數(shù)據(jù)分析師能夠牢牢把握各種問題的要害绩社、指明正確的方向摔蓝。

3.2 數(shù)據(jù)分析的基本步驟是什么?

數(shù)據(jù)分析流程

優(yōu)秀的數(shù)據(jù)分析師同時也是優(yōu)秀的溝通者愉耙。...未明確問題或目標(biāo)就進(jìn)行數(shù)據(jù)分析贮尉,就如同未定下目的地就上路旅行一樣。...所以朴沿,與你的客戶溝通猜谚,了解越深,你的分析越有可能派上用場赌渣。

將大問題劃分為小問題:你無法直接回答大問題龄毡,但是,通過回答從大問題分解出來的小問題锡垄,你就可以找到大問題的答案沦零。

進(jìn)行有效的比較,是數(shù)據(jù)分析的核心货岭。

你對外界的假設(shè)和你確定的觀點(diǎn)路操,就是你的心智模型

讓自己介入分析的意思是:做出自己的明確假設(shè)千贯,并且以自己的信用為自己的結(jié)論做擔(dān)保屯仗。所以,在撰寫最終報(bào)告的時候搔谴,一定要提到你自己魁袜,這樣客戶才有信心。

除非將分析形成報(bào)表供制定決策敦第,否則分析將毫無用處峰弹。

3.3 如何檢驗(yàn)數(shù)據(jù)分析成果的正確性?

根據(jù)數(shù)據(jù)分析的結(jié)論做決策芜果,但為了避免決策失誤鞠呈,應(yīng)先做小面積的實(shí)驗(yàn)。所以右钾,科學(xué)的實(shí)驗(yàn)可以檢驗(yàn)分析成果的正確性蚁吝。

做個好實(shí)驗(yàn)

分組比較的方法普遍用于臨床醫(yī)學(xué)上。一種新藥有沒有療效舀射,除非做對照實(shí)驗(yàn)窘茁,否則無法確定用藥的治療是否比不用藥的治療更有效,甚至還會有更大的副作用危害脆烟。

混雜因素就是研究對象的個體差異山林,也可以稱為噪音。它們不是你試圖進(jìn)行比較的因素浩淘,最終會導(dǎo)致分析結(jié)果的敏感度變差捌朴。

做到什么程度才算查清了混雜因素吴攒?與其說是科學(xué),不如說是藝術(shù)砂蔽。你不妨就自己正在研究的問題問自己一些常識性問題洼怔,借此想象哪些變量可能會影響你的分析結(jié)果。正如數(shù)據(jù)分析和統(tǒng)計(jì)學(xué)中的各種手段一樣左驾,無論你的量化技術(shù)多么出神入化镣隶,真正的重點(diǎn)卻永遠(yuǎn)在于:分析結(jié)論要有意義

3.4 關(guān)于最優(yōu)化诡右,有何啟發(fā)安岂?

所謂最優(yōu)化,就是借助線性代數(shù)求解最大值(或最小值)帆吻。在以往的工作經(jīng)驗(yàn)中域那,我接觸過“利潤最大化、排班”等需求猜煮,為此使用過GLPK次员、Gurobi等線性規(guī)劃工具箱。雖然期間收獲不小王带,但始終有一個問題困擾大家淑蔚,即:用戶對最優(yōu)化模型的輸出成果不甚滿意。

最優(yōu)化模型

你的假設(shè)立足于不斷變化的實(shí)際情況愕撰。所以刹衫,接納“不完美及實(shí)際情況在不斷變化”的事實(shí),就能理解“最優(yōu)化模型只是參考搞挣,不是一勞永逸的萬能鑰匙”带迟。...模型現(xiàn)在是在起作用,但可能會突然失靈柿究。你需要做好準(zhǔn)備邮旷,以便在必要的時候重新構(gòu)建分析方法,反復(fù)不斷地進(jìn)行構(gòu)建正是分析師的工作蝇摸。

在本書中,介紹了使用excel自帶的功能來解決最優(yōu)化問題的案例办陷。這對于小數(shù)據(jù)集來說夠用貌夕,但如果數(shù)據(jù)集較大,建議使用專業(yè)的線性規(guī)劃工具民镜。

3.5 什么是假設(shè)檢驗(yàn)啡专?

曾經(jīng)朋友們討論到一個話題,即:學(xué)習(xí)科技知識制圈,有何用们童?答案是預(yù)測未來畔况。就拿“數(shù)據(jù)分析”來說,其結(jié)果用于決策慧库,難道決策不就是預(yù)測未來嗎跷跪?掌握并運(yùn)用項(xiàng)目管理知識,把工作目標(biāo)分解為合理的任務(wù)計(jì)劃齐板,說到底也是預(yù)測未來吵瞻。

如何預(yù)測未來?關(guān)于這個話題甘磨,本書用一個“手機(jī)殼生產(chǎn)商預(yù)測新手機(jī)何時上市”的案例來講解假設(shè)檢驗(yàn)橡羞、證偽法的知識。

關(guān)鍵的知識點(diǎn)是:

  • 從各種渠道收集消息(注意济舆,消息也是一種數(shù)據(jù))卿泽;
  • 書中列舉的關(guān)注消息有:經(jīng)濟(jì)形勢(會影響消費(fèi)者支出意愿)、零配件供貨商產(chǎn)量(會影響新品手機(jī)的產(chǎn)量)滋觉、手機(jī)生產(chǎn)商的競爭對手的近期活動(會影響手機(jī)生產(chǎn)商如何應(yīng)對競爭)等等又厉;
  • 基于收集到的情報(bào),確定它們與想預(yù)測目標(biāo)的正負(fù)關(guān)系椎瘟;
  • 對分析模型進(jìn)行假設(shè)檢驗(yàn)覆致,而且要使用證偽法,回避滿意法肺蔚。

并非只有數(shù)字表格才叫做數(shù)據(jù)煌妈。只要證據(jù)能夠幫助你按照強(qiáng)弱程度對假設(shè)進(jìn)行排列,它就具有診斷性宣羊。

若一種變量增大意味著另一種變量也增大璧诵,則為正相關(guān),反之為負(fù)相關(guān)仇冯。

請勿試圖選出最合理的假設(shè)之宿,只需剔除無法證實(shí)的假設(shè)——這就是假設(shè)檢驗(yàn)的基礎(chǔ):證偽

滿意法的嚴(yán)重問題是:當(dāng)人們在未對其它假設(shè)進(jìn)行透徹分析的情況下選取某種假設(shè)時苛坚,往往會堅(jiān)持這個假設(shè)比被,即使反面證據(jù)堆積如山也往往視而不見。證偽法則讓人們對各種假設(shè)感覺更敏銳泼舱,從而防止掉入認(rèn)知陷阱等缀。

現(xiàn)實(shí)世界中的各種原因呈現(xiàn)網(wǎng)絡(luò)關(guān)系,而非線性關(guān)系娇昙。線性等于直覺尺迂,容易忽略其它信息。在現(xiàn)實(shí)世界里,各種原因在相關(guān)變量構(gòu)成的網(wǎng)絡(luò)中傳導(dǎo)噪裕,你的模型怎么可能獨(dú)善其身呢蹲盘?作為一位分析師,你的視野要比這個簡單的模型開闊才行膳音,要渴望看出因果關(guān)系網(wǎng)絡(luò)召衔。

優(yōu)秀分析師的理想是找到復(fù)雜問題的非直覺答案。你會愿意聘用一個思想保守的數(shù)據(jù)分析師嗎严蓖?如果客戶真正有興趣從數(shù)據(jù)中挖掘一些新信息薄嫡,就會尋覓能想人所不能想的人才。

分析師們一個很好的經(jīng)驗(yàn)法則是:當(dāng)你開始懷疑因果關(guān)系的走向時颗胡,請進(jìn)行反向思考毫深,看看結(jié)果會怎么樣。

假設(shè)檢驗(yàn)毒姨,是一種根據(jù)情報(bào)預(yù)測未來的方法哑蔫。難度在于:收集情報(bào)的多少、以及情報(bào)的準(zhǔn)確性弧呐。物價會不會上漲闸迷?股票是升還是降?貌似都可以用這個方法俘枫,但在這些領(lǐng)域內(nèi)我們收集情報(bào)的能力遠(yuǎn)遠(yuǎn)低于專業(yè)咨詢公司腥沽、智庫。盡管如此鸠蚪,仍然值得掌握假設(shè)檢驗(yàn)今阳、證偽法,因?yàn)樵谧约簩I(yè)從事的業(yè)務(wù)領(lǐng)域內(nèi)茅信,我們可以做得比較專業(yè)盾舌。

3.6 什么是貝葉斯統(tǒng)計(jì)?

前面介紹的假設(shè)檢驗(yàn)蘸鲸、證偽法妖谴,可以處理異質(zhì)數(shù)據(jù),但如果碰到直接概率問題酌摇,就要使用貝葉斯統(tǒng)計(jì)了膝舅。貝葉斯概率準(zhǔn)則提供了一種利用已知概率來估算未知概率的有效方法,其基礎(chǔ)公式是:

P(A | B) = P(B | A) * P(A) / P(B)

其中妙痹,P(A | B)的解讀為:B中出現(xiàn)A的概率铸史。

關(guān)于貝葉斯概率的入門案例,可以參考以前整理的《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》讀書筆記4怯伊。

3.7 什么是主觀概率?

主觀概率是一種將嚴(yán)謹(jǐn)融入直覺的簡便方法,結(jié)合標(biāo)準(zhǔn)偏差來評估數(shù)據(jù)的分布耿芹。

其實(shí)我們遇到過主觀概率的實(shí)際應(yīng)用崭篡,如:
用戶在社交平臺上對我們的移動客戶端評價,有激烈的說“非常難用”吧秕、有敷衍的說“尚可忍受”琉闪、有委婉的說“建議改進(jìn)”。但如果去聯(lián)絡(luò)這些用戶砸彬,就會發(fā)現(xiàn)颠毙,他們只是表達(dá)情緒的激烈程度不一樣,但都還會繼續(xù)使用我們的移動客戶端砂碉。那么如何更精確的收集用戶的意向呢蛀蜜?答案就是問卷調(diào)查。

口語表達(dá)上的概率用詞有:可能增蹭、極不可能滴某、可能性更大、有可能滋迈、可能不霎奢、不可能、可能會饼灿、肯定幕侠、大有機(jī)會...。不同的人碍彭,對這些概率用詞的情緒感覺不同晤硕,A說的非常有可能與B說的完全不可能,也許都想表達(dá)30%的概率硕旗。

如果用一個數(shù)字形式的概率來表示自己對某事的確認(rèn)程度窗骑,所用的就是主觀概率。...主觀概率是對分歧內(nèi)容和分歧大小的一種精確規(guī)范漆枚,可以避免表達(dá)不當(dāng)帶來的矛盾激化创译,從而讓數(shù)據(jù)分析師抓住問題焦點(diǎn),進(jìn)而解決問題墙基。

主觀概率是根據(jù)規(guī)律進(jìn)行分析的巧妙方法软族,尤其是在預(yù)測孤立事件,但缺乏相同條件下的歷史經(jīng)驗(yàn)的情況下残制。

標(biāo)準(zhǔn)偏差度量的是典型的分析點(diǎn)與數(shù)據(jù)集平均值的差距立砸。偏差越大,表明分歧也越大初茶。

3.8 什么是啟發(fā)法颗祝?

你是如何做決定的?

  • 憑沖動做決定(直覺)?
  • 還是憑幾個精心選取的關(guān)鍵數(shù)據(jù)做決定(啟發(fā)法)螺戳?
  • 或是構(gòu)建一套包含所有變量的模型搁宾,然后得出最優(yōu)解(最優(yōu)化)?

以上答案可能都對倔幼,但這些答案卻代表完全不同的思維模式盖腿,認(rèn)識到這一點(diǎn)很重要。... 大多數(shù)思維活動都是啟發(fā)式的损同,最優(yōu)化是一種理想境界翩腐,啟發(fā)法是從直覺走向最優(yōu)化的橋梁。

忽視整個系統(tǒng)而只關(guān)心一個變量是不對的膏燃,但關(guān)注所有數(shù)據(jù)進(jìn)行分析茂卦,艱深耗時。精心選擇與問題相關(guān)的部分?jǐn)?shù)據(jù)蹄梢,然后根據(jù)它們對整個系統(tǒng)做出結(jié)論疙筹,這就是在使用啟發(fā)法

工作中禁炒,面對銷售量統(tǒng)計(jì)圖而咆,你如何解釋銷量上升的原因?可能很難精確解釋幕袱,因?yàn)橛绊戜N量的因素太多了暴备,如:

  • 經(jīng)濟(jì)回暖,人們愿意消費(fèi)了们豌;
  • 現(xiàn)在是本行業(yè)的銷售旺季涯捻;
  • 最近的一個公司宣傳上了熱搜;
  • 投放了一個好產(chǎn)品望迎;
  • 支撐在線電商的系統(tǒng)做了優(yōu)化障癌;
  • 合作伙伴不抖動了;
  • 領(lǐng)導(dǎo)以身作則辩尊,帶領(lǐng)大家攻堅(jiān)涛浙;
  • ...

要對所有因素去分析太難了,甚至連搜集數(shù)據(jù)都做不到摄欲。但可以挑選幾個關(guān)鍵因素進(jìn)行分析轿亮。記住:我們無法證明改善都是我們的功勞胸墙,但通過分析結(jié)果有理由相信我注,我們的付出造成了這些改善。

3.9 什么是回歸預(yù)測迟隅?

本書中講解的是線性回歸但骨,入門案例可以參考以前整理的《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》讀書筆記8励七。

線性回歸

使用已有的數(shù)據(jù)集可以構(gòu)建回歸方程式,進(jìn)而使用該方程式預(yù)測未來嗽冒。但要注意呀伙,回歸方程式是有適用范圍的补履。內(nèi)插法對數(shù)據(jù)范圍內(nèi)的數(shù)值進(jìn)行預(yù)測添坊,很準(zhǔn)確,這是回歸法的目的箫锤。預(yù)測數(shù)據(jù)范圍外的數(shù)值贬蛙,稱為外插法,很不準(zhǔn)確谚攒。你必須把回歸方程式的適用范圍告訴用戶阳准。

只要數(shù)據(jù)呈現(xiàn)正態(tài)分布,大量高效而簡單的統(tǒng)計(jì)方法就能派上用場馏臭。...如果直方圖上顯示有多于一個的峰值野蝇,且你想弄明白為何不是正態(tài)分布的,那么就可以劃分?jǐn)?shù)據(jù)子集括儒,重新繪制多個直方圖绕沈、找到原因。

3.10 如何解釋和管理誤差帮寻?

預(yù)測很少不偏不倚乍狐,這種實(shí)際結(jié)果與預(yù)測結(jié)果之間的偏差,叫機(jī)會誤差固逗,統(tǒng)計(jì)學(xué)中又稱為殘差浅蚪。

預(yù)測有失精準(zhǔn)并不稀奇。不過烫罩,如果在進(jìn)行預(yù)測的時候指出誤差范圍惜傲,你和你的客戶就不僅能知道平均預(yù)測值,還能知道該誤差造成的典型偏差贝攒。指出誤差可以讓預(yù)測更全面盗誊,可信度更高

均方根誤差定量表示殘差分布饿这。

分組浊伙,減少回歸誤差

將數(shù)據(jù)分拆為幾個組稱為分割,分割的根本目的是管理誤差长捧。如果為幾個分組分別創(chuàng)建預(yù)測模型嚣鄙,比單獨(dú)一個模型更能減小誤差,則應(yīng)進(jìn)行分割串结。

優(yōu)秀的歸回分析兼具監(jiān)解釋功能和預(yù)測功能哑子。如果號稱零誤差舅列,那就是表明沒有預(yù)測功能。這也稱為過擬合卧蜓。

3.11 有哪些圖形化展示數(shù)據(jù)的技巧帐要?

數(shù)據(jù)可視化:創(chuàng)建優(yōu)秀數(shù)據(jù)圖形的第一要務(wù)就是促使用戶謹(jǐn)慎思考并制定正確決策,優(yōu)秀的數(shù)據(jù)分析從始至終都離不開“用數(shù)據(jù)思考”弥奸。

優(yōu)秀數(shù)據(jù)圖表的特點(diǎn)

  • 展示了數(shù)據(jù)榨惠;
  • 做了高明的比較;
  • 展示了多個變量盛霎;
  • 美觀赠橙。
如何選擇圖表類型?

數(shù)據(jù)分析師喜歡用散點(diǎn)圖發(fā)現(xiàn)因果關(guān)系愤炸,即一個變量影響另一個變量的關(guān)系期揪。通常用散點(diǎn)圖的X軸代表自變量,用Y軸代表因變量规个。

柱狀圖(直方圖)能夠迅速二有效地匯總數(shù)據(jù)凤薛,用于度量數(shù)據(jù)的分布、差異诞仓、集中趨勢等缤苫。

如果數(shù)據(jù)圖表能對每個數(shù)據(jù)的三個以上的變量進(jìn)行展示,這個圖表就是多元的狂芋。盡量讓圖形多元化最有可能促成最有效的比較榨馁。

我以前習(xí)慣用一個圖表來解釋數(shù)據(jù),其實(shí)完全可以并列兩個圖表進(jìn)行對比展示帜矾。如:一個網(wǎng)站的瀏覽次數(shù)翼虫、瀏覽時長、回頭率與營業(yè)額的關(guān)系屡萤,都做在一個圖表中有難度珍剑、且不夠美觀。那么可以分別做成3個圖表死陆,但可以放在一起展示招拙。

當(dāng)你描述你的數(shù)據(jù)圖表時,需要論述可相互換用的兩種因果模型或圖解措译。能完成這個任務(wù)說明你非常公正:讓客戶知道你不僅會展示自己最喜歡的一面别凤,還會徹頭徹尾地考慮自己提出的原理中可能存在的問題點(diǎn)。

激發(fā)制圖靈感领虹、提高制圖能力的渠道:

  1. 學(xué)習(xí)大師的著作规哪,如讀數(shù)據(jù)圖形化領(lǐng)域權(quán)威Edward Tufte的著作;
  2. 看到制作精良的圖表案例塌衰,用心的收集下來(有同事在這方便比我做得好)诉稍。

4. 收獲與行動

收獲知識蝠嘉、付出行動、體現(xiàn)價值

4.1 啊哈

此處收集了書中讓我眼前一亮的句子杯巨。

考慮不確定因素蚤告、盲點(diǎn)會讓人感覺不爽,但回報(bào)顯著服爷,因?yàn)?strong>了解自己的知識缺陷非常重要杜恰。數(shù)據(jù)分析也是如此,“反查”方法會揭示出未知信息层扶,而不是已知信息箫章。

千萬要保存原始數(shù)據(jù),避免進(jìn)行任何數(shù)據(jù)處理镜会。即使是最好的數(shù)據(jù)分析師也會失誤,必須保留將工作結(jié)果與原始數(shù)據(jù)進(jìn)行比較的機(jī)會终抽。

對于分析來說戳表,大量的、準(zhǔn)確的數(shù)據(jù)是好的開頭昼伴。但數(shù)據(jù)分析有一個不可告人的秘密——到手的數(shù)據(jù)往往算不上井井有條匾旭,數(shù)據(jù)分析師花在數(shù)據(jù)整理上的時間多過數(shù)據(jù)分析上的時間。所以擅長使用數(shù)據(jù)處理工具圃郊、擁有對海量數(shù)據(jù)進(jìn)行清洗的能力非常重要价涝。

免不了要報(bào)告壞消息是數(shù)據(jù)分析師工作的一部分。不過持舆,同樣的消息卻可以用不同的方式來表達(dá)色瘩。頂級數(shù)據(jù)分析師懂得妥當(dāng)?shù)貓?bào)告有可能令人沮喪的消息

我們都碰到過在經(jīng)濟(jì)上逸寓、認(rèn)知上很費(fèi)力的刁鉆問題居兆。對于這類棘手的問題,人們天生的反應(yīng)就是答非所問竹伸,這實(shí)屬及其正常泥栖、及其人性的現(xiàn)象。

數(shù)據(jù)分析的根本在于:妥善分解問題勋篓、為數(shù)據(jù)套上適當(dāng)?shù)男闹悄P秃徒y(tǒng)計(jì)模型吧享、做出正確的判斷,但并不保證次次得到精確的答案譬嚣。

4.2 下一步行動:實(shí)操本書中的例子

本書每個章節(jié)的案例都非常精彩钢颂,同時還提供了原始數(shù)據(jù)下載的地址」氯伲看懂了是一回事甸陌,自己去操作一次更好须揣。

4.3 下一步行動:收集制作精良的數(shù)據(jù)圖表

有些人更具有設(shè)計(jì)圖形報(bào)表的天賦,可以向他們的成果學(xué)習(xí)钱豁。在閱讀出版物時耻卡,關(guān)注技高一籌的作品,保留下來牲尺,思考它好在哪里卵酪,可以提高自己制作數(shù)據(jù)報(bào)表的技能。

4.4 下一步行動:學(xué)習(xí)統(tǒng)計(jì)學(xué)知識

許多數(shù)據(jù)分析著作其實(shí)就是統(tǒng)計(jì)學(xué)著作谤碳,因?yàn)榻y(tǒng)計(jì)學(xué)領(lǐng)域擁有的大量數(shù)據(jù)分析技術(shù)對數(shù)據(jù)分析及其重要溃卡。統(tǒng)計(jì)知識越淵博,分析工作越有可能取得輝煌成就蜒简。

4.5 拓展閱讀

在本書中提到或引用了如下書籍:

  1. 《深入淺出統(tǒng)計(jì)學(xué)》瘸羡,道恩·格里菲思
  2. 《出色的證據(jù)》,Edward Tufte

現(xiàn)實(shí)世界非常復(fù)雜搓茬,因此我們用心智模型來理解現(xiàn)實(shí)犹赖。心智模型可能是一些與生俱來的先天稟賦,也可能是后天學(xué)會的理論卷仑,不管是哪種情況峻村,都會大大影響你對數(shù)據(jù)的解釋。


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末锡凝,一起剝皮案震驚了整個濱河市粘昨,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌窜锯,老刑警劉巖张肾,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異衬浑,居然都是意外死亡捌浩,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進(jìn)店門工秩,熙熙樓的掌柜王于貴愁眉苦臉地迎上來尸饺,“玉大人,你說我怎么就攤上這事助币±颂” “怎么了?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵眉菱,是天一觀的道長迹栓。 經(jīng)常有香客問我,道長俭缓,這世上最難降的妖魔是什么克伊? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任酥郭,我火速辦了婚禮,結(jié)果婚禮上愿吹,老公的妹妹穿的比我還像新娘不从。我一直安慰自己镊讼,他們只是感情好病蛉,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著枷餐,像睡著了一般坷衍。 火紅的嫁衣襯著肌膚如雪寝优。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天枫耳,我揣著相機(jī)與錄音乏矾,去河邊找鬼。 笑死嘉涌,一個胖子當(dāng)著我的面吹牛妻熊,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播仑最,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼帆喇!你這毒婦竟也來了警医?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤坯钦,失蹤者是張志新(化名)和其女友劉穎预皇,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體婉刀,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡吟温,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了突颊。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片鲁豪。...
    茶點(diǎn)故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖律秃,靈堂內(nèi)的尸體忽然破棺而出爬橡,到底是詐尸還是另有隱情,我是刑警寧澤棒动,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布糙申,位于F島的核電站,受9級特大地震影響船惨,放射性物質(zhì)發(fā)生泄漏柜裸。R本人自食惡果不足惜缕陕,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望疙挺。 院中可真熱鬧扛邑,春花似錦、人聲如沸衔统。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽锦爵。三九已至舱殿,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間险掀,已是汗流浹背沪袭。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留樟氢,地道東北人冈绊。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像埠啃,于是被迫代替她去往敵國和親死宣。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容