用數(shù)據(jù)的心智模式去分析 --《深入淺出數(shù)據(jù)分析》讀書筆記

國慶假期閱讀了幾本數(shù)據(jù)分析相關(guān)的書,以讀書筆記的方式推薦給大家掰烟。

本篇為 《深入淺出數(shù)據(jù)分析》/ 的讀書筆記爽蝴。

全書一共13章,涉及數(shù)據(jù)整理纫骑、數(shù)據(jù)分析蝎亚、假設(shè)檢驗(yàn)、回歸分析先馆、實(shí)驗(yàn)檢驗(yàn)等數(shù)據(jù)分析的方法发框,以及Excel、R煤墙、DB等數(shù)據(jù)分析的工具缤底。下面先按照章節(jié)整理下讀書筆記。

CH1 什么是數(shù)據(jù)分析

本章和CH8啟發(fā)法中都寫了對數(shù)據(jù)分析的理解

CH1:所謂數(shù)據(jù)分析是心智模型(直覺番捂、數(shù)據(jù)的心智)在數(shù)據(jù)上的體現(xiàn)个唧,人們的心智模型影響對數(shù)據(jù)的解釋,大腦無法處理所有數(shù)據(jù)设预,當(dāng)面對紛繁的數(shù)據(jù)的時(shí)候大腦會依賴心智模式做出選擇徙歼。

CH8:數(shù)據(jù)分析就是妥善分解問題,為數(shù)據(jù)套上適當(dāng)?shù)男闹悄P秃徒y(tǒng)計(jì)模型,做出正確的判斷魄梯,但不保證次次正確

如何避免心智模式對數(shù)據(jù)分析的影響桨螺,下面是一些建議(用數(shù)據(jù)的心智去分析):


1.流程: 確定問題--分解問題--評估/分析問題(資源和數(shù)據(jù)約束情況可以多用啟發(fā)法、假設(shè)法)--做出決策 酿秸,循環(huán)迭代灭翔,直至獲得最優(yōu)解(這里要綜合考慮資源、代價(jià))

2.方法: 明確目標(biāo)辣苏、基于對業(yè)務(wù)的理解和已知的信息作出假設(shè)(提速的關(guān)鍵)肝箱、使用反查表尋找自己思維盲區(qū)(這個(gè)需要積累或者同事的建議)、通過假設(shè)檢驗(yàn)過程拉取更多數(shù)據(jù)

3.建議: 客戶未必明確他們的需求(有時(shí)候客戶的論點(diǎn)值得商榷)稀蟋、分解數(shù)據(jù)的過程可能就是解決問題的過程

上面的數(shù)據(jù)分析流程和方法和《麥肯錫意識》中推崇的解決問題的思路是一致的煌张,建議結(jié)合閱讀。

CH2 實(shí)證檢驗(yàn)

實(shí)證檢驗(yàn)是一種觀察研究法退客,面對復(fù)雜問題骏融,通過對部分因素的控制,研究對象差異性

控制混雜因素: 拆分?jǐn)?shù)據(jù)為同質(zhì)性的小數(shù)據(jù)塊

讓數(shù)據(jù)說話萌狂,策略選擇:應(yīng)用不同策略到控制組档玻、對照組,要保證組之間的相似性(消除混雜因素影響的好辦法)茫藏,從而證明策略效果的差異性

CH3 最優(yōu)化

我們處理的最優(yōu)化問題都可以轉(zhuǎn)換為一個(gè)函數(shù)柏蘑,有目標(biāo)變量蛔屹、控制變量议街,以及我們不可控的約束條件恩掷。

本章介紹了一個(gè)實(shí)現(xiàn)最優(yōu)化的工具碧囊,Microsoft Excel Solver

CH4 圖形化 可視化

通常數(shù)據(jù)分析過程中數(shù)據(jù)探索树灶、結(jié)果呈現(xiàn)都需要用到可視化的圖形,比如散點(diǎn)圖(多元圖形)糯而、折線圖天通、柱圖、氣泡圖(多元圖形)等等熄驼。

但是不要忘記分析的目標(biāo)像寒,龐大的數(shù)據(jù)都是為目標(biāo)服務(wù),而不是為了好看的可視化效果瓜贾。

實(shí)現(xiàn)可視化的工具既有Excel诺祸、Tableau也有R、Python等程序化工具祭芦。

CH5 假設(shè)檢驗(yàn)

假設(shè)檢驗(yàn)作為一種數(shù)據(jù)分析中常用的非直覺方法(非線性思考)筷笨,也叫證偽法。再次呼應(yīng)開頭時(shí)候講的什么是數(shù)據(jù)分析,這里提到了解決問題的直覺法(往往只看到一個(gè)選項(xiàng)胃夏,不靠譜)轴或,以及信仰數(shù)據(jù)的假設(shè)法,目的是實(shí)現(xiàn)最優(yōu)化的解決方案仰禀。

在我們面對復(fù)雜問題或者數(shù)據(jù)比較少的問題時(shí)照雁,假設(shè)法是一個(gè)開啟分析的利器。通過假設(shè)我們構(gòu)建問題的模型答恶,列出所有的相關(guān)變量饺蚊,并分析變量之間的相關(guān)關(guān)系(這里可以參考《系統(tǒng)思維》里面提到的系統(tǒng)循環(huán)圖:調(diào)節(jié)回路、增強(qiáng)回路)亥宿。 通過變量之間的網(wǎng)狀關(guān)系進(jìn)行問題的模擬卸勺。

針對假設(shè)我們要使用證偽法,而避免使用滿意法烫扼,目的就是不放過每個(gè)可能的假設(shè)曙求,否定性最小的假設(shè)往往就是我們的最優(yōu)選擇。

證偽的過程可以使用邏輯樹或者問題樹的形式進(jìn)行組織映企,充分利用手頭資料進(jìn)行“是或否”的回答悟狱。

CH6 貝葉斯統(tǒng)計(jì)和概率

本章主要介紹了概率、先驗(yàn)概率堰氓、后驗(yàn)概率等概念挤渐。

CH7 主觀概率 信念數(shù)字化

數(shù)據(jù)分析的過程中并非不可以使用直覺,但是需要以更嚴(yán)謹(jǐn)?shù)姆绞饺谌霐?shù)據(jù)分析過程双絮。

數(shù)字化的主觀概率可以讓我們對專家們之間的分歧有更確切的認(rèn)知浴麻。

專家信念轉(zhuǎn)化為主觀概率,匯總?cè)后w(這里群體是解決個(gè)體主觀偏差的關(guān)鍵點(diǎn))的主觀概率并進(jìn)行一些相關(guān)的偏差度量分析可以實(shí)現(xiàn)不錯(cuò)的效果囤攀。

一旦有更確定的數(shù)據(jù)可以進(jìn)行主觀信念的修正软免,可以用上一章介紹的貝葉斯統(tǒng)計(jì)條件概率進(jìn)行修正。

CH8 啟發(fā)法焚挠,從直覺到最優(yōu)化

任何數(shù)據(jù)分析都是有代價(jià)的膏萧,具體到模型(約束條件、決策變量)就是數(shù)據(jù)的獲取往往是有代價(jià)的蝌衔。

啟發(fā)法很好的解決了數(shù)據(jù)獲取代價(jià)和收益平衡的問題榛泛,通過選取一兩個(gè)變量,通過這些變量對整個(gè)系統(tǒng)/模型分析得出結(jié)論噩斟。

啟發(fā)法是從直覺走向最優(yōu)化的橋梁曹锨,通常直覺分析中我們只看到一個(gè)選項(xiàng),通過啟發(fā)法我們可以看到多個(gè)選項(xiàng)剃允,并可能獲取最優(yōu)答案(所有可選答案)艘希。

啟發(fā)法在心理學(xué)(心理學(xué)定義-用一種便于理解的屬性代替一種難以理解的屬性)和計(jì)算機(jī)科學(xué)(一種解決問題的方法硼身,可以得出正確答案,但不保證最優(yōu)答案)中有廣泛應(yīng)用覆享,在解決復(fù)雜或者模糊問題時(shí)可以大大提高我們處理的效率佳遂。

個(gè)人覺得啟發(fā)法和假設(shè)檢驗(yàn),都是很好的提高數(shù)據(jù)分析效率的方法撒顿。 具體的區(qū)別大家有什么想法丑罪?

CH9 直方圖

本章主要介紹了如何用Excel、R畫直方圖凤壁,直方圖是一個(gè)很好的觀察數(shù)據(jù)分布吩屹、差異、集中趨勢等的工具拧抖。

CH10 回歸和預(yù)測

數(shù)據(jù)分析的目的分類煤搜、預(yù)測是最常見兩類,回歸就是一個(gè)解決預(yù)測的常用方法唧席。

通常結(jié)合散點(diǎn)圖觀察數(shù)據(jù)的相關(guān)性擦盾,通過回歸算法形成回歸模型(通過數(shù)據(jù)訓(xùn)練算法得出參數(shù))。

CH11 誤差的理解

預(yù)測和現(xiàn)實(shí)結(jié)果之間難免有誤差淌哟,通常在進(jìn)行預(yù)測分析的時(shí)候我們需要指出誤差范圍迹卢。

在應(yīng)用回歸模型進(jìn)行預(yù)測的時(shí)候我們需要注意:

回歸模型有適用的數(shù)據(jù)范圍,如果超出范圍進(jìn)行預(yù)測(外插法)往往失準(zhǔn)

回歸模型中存在殘差徒仓,通常我們有均方根誤差進(jìn)行計(jì)量(殘差的標(biāo)準(zhǔn)差)

回歸模型的合理分拆腐碱,有助于減少誤差實(shí)現(xiàn)更準(zhǔn)確的預(yù)測

CH12 關(guān)系型數(shù)據(jù)庫

關(guān)系數(shù)據(jù)庫是我們數(shù)據(jù)分析中常見的數(shù)據(jù)源,相關(guān)的表結(jié)構(gòu)掉弛、SQL是數(shù)據(jù)分析師應(yīng)該掌握的症见。

CH13 整理數(shù)據(jù)

數(shù)據(jù)分析過程中耗時(shí)最長的往往是數(shù)據(jù)整理、清洗殃饿。

在數(shù)據(jù)整理的過程中谋作,我們一定要明確目標(biāo)(輸出格式),基于目標(biāo)進(jìn)行原始數(shù)據(jù)和目標(biāo)數(shù)據(jù)的映射匹配壁晒。



重新整理13個(gè)章節(jié):

分析思路(CH5假設(shè)檢驗(yàn)瓷们、CH8啟發(fā)法业栅、CH2實(shí)驗(yàn)檢驗(yàn)秒咐、CH1什么時(shí)候數(shù)據(jù)分析

分析工具(CH6貝葉斯統(tǒng)計(jì)、CH3最優(yōu)化計(jì)算碘裕、CH10回歸計(jì)算)

結(jié)果展現(xiàn)(CH4可視化携取、CH9直方圖)

數(shù)據(jù)處理(CH13整理數(shù)據(jù)、CH12關(guān)系型數(shù)據(jù)庫)

我們發(fā)現(xiàn)數(shù)據(jù)分析中思路是根本帮孔,黑體章節(jié)推薦重點(diǎn)閱讀雷滋。

本書閱讀過程中穿插閱讀了

《麥肯錫意識》

《周志華-機(jī)器學(xué)習(xí)》

還推薦閱讀 深入淺出系列圖書

《深入淺出統(tǒng)計(jì)學(xué)》

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末不撑,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子晤斩,更是在濱河造成了極大的恐慌焕檬,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,509評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件澳泵,死亡現(xiàn)場離奇詭異实愚,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)兔辅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,806評論 3 394
  • 文/潘曉璐 我一進(jìn)店門腊敲,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人维苔,你說我怎么就攤上這事碰辅。” “怎么了介时?”我有些...
    開封第一講書人閱讀 163,875評論 0 354
  • 文/不壞的土叔 我叫張陵没宾,是天一觀的道長。 經(jīng)常有香客問我潮尝,道長榕吼,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,441評論 1 293
  • 正文 為了忘掉前任勉失,我火速辦了婚禮羹蚣,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘乱凿。我一直安慰自己顽素,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,488評論 6 392
  • 文/花漫 我一把揭開白布徒蟆。 她就那樣靜靜地躺著胁出,像睡著了一般。 火紅的嫁衣襯著肌膚如雪段审。 梳的紋絲不亂的頭發(fā)上全蝶,一...
    開封第一講書人閱讀 51,365評論 1 302
  • 那天,我揣著相機(jī)與錄音寺枉,去河邊找鬼抑淫。 笑死,一個(gè)胖子當(dāng)著我的面吹牛姥闪,可吹牛的內(nèi)容都是我干的始苇。 我是一名探鬼主播,決...
    沈念sama閱讀 40,190評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼筐喳,長吁一口氣:“原來是場噩夢啊……” “哼催式!你這毒婦竟也來了函喉?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,062評論 0 276
  • 序言:老撾萬榮一對情侶失蹤荣月,失蹤者是張志新(化名)和其女友劉穎管呵,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體哺窄,經(jīng)...
    沈念sama閱讀 45,500評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡撇寞,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,706評論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了堂氯。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蔑担。...
    茶點(diǎn)故事閱讀 39,834評論 1 347
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖咽白,靈堂內(nèi)的尸體忽然破棺而出啤握,到底是詐尸還是另有隱情,我是刑警寧澤晶框,帶...
    沈念sama閱讀 35,559評論 5 345
  • 正文 年R本政府宣布排抬,位于F島的核電站,受9級特大地震影響授段,放射性物質(zhì)發(fā)生泄漏蹲蒲。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,167評論 3 328
  • 文/蒙蒙 一侵贵、第九天 我趴在偏房一處隱蔽的房頂上張望届搁。 院中可真熱鬧,春花似錦窍育、人聲如沸卡睦。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,779評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽表锻。三九已至,卻和暖如春乞娄,著一層夾襖步出監(jiān)牢的瞬間瞬逊,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,912評論 1 269
  • 我被黑心中介騙來泰國打工仪或, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留确镊,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,958評論 2 370
  • 正文 我出身青樓溶其,卻偏偏與公主長得像骚腥,于是被迫代替她去往敵國和親敦间。 傳聞我的和親對象是個(gè)殘疾皇子瓶逃,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,779評論 2 354

推薦閱讀更多精彩內(nèi)容