哈嘍戒突,大家好,我是可樂
今天給大家推薦這本《深入淺出統(tǒng)計(jì)學(xué)》,文末有我總結(jié)的知識(shí)圖譜
首發(fā)于公眾號(hào)【可樂的數(shù)據(jù)分析之路】。
《深入淺出統(tǒng)計(jì)學(xué)》這本書我看了好幾遍酬土,一直沒法下筆寫它的總結(jié),因?yàn)楦杏X還沒有征服它格带,每次感覺懂了的時(shí)候撤缴,總會(huì)遇到不明白的地方,不過我還是鼓起勇氣來寫這篇讀書筆記叽唱,目的是向大家推薦這本神書屈呕,值得反復(fù)咀嚼。
<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>
建議同時(shí)結(jié)合賈俊平老師的《統(tǒng)計(jì)學(xué)》這本書一起食用棺亭,效果會(huì)更佳哦虎眨。
第一部分:數(shù)據(jù)的度量
第一節(jié) 信息圖形化 的內(nèi)容是講作圖的,數(shù)據(jù)總歸要化繁為簡,進(jìn)行可視化的嗽桩,我在
如何進(jìn)行數(shù)據(jù)圖形化
這篇文章中也有寫過這部分內(nèi)容岳守,大家可以去看看,這一節(jié)最后還著重講了怎么做直方圖碌冶,這個(gè)內(nèi)容我也是寫了很久湿痢,兩年前的冷飯?jiān)賮沓匆幌掳桑?/p>
我們拿到數(shù)據(jù)首先要對數(shù)據(jù)進(jìn)行一個(gè)概括性的度量,從哪幾個(gè)方面去度量呢扑庞?第二節(jié) 集中趨勢的量度和第三節(jié) 分散性與變異性的量度譬重,這兩節(jié)內(nèi)容就是在講數(shù)據(jù)的概括性度量問題,也就是描述性統(tǒng)計(jì)分析罐氨,包含集中趨勢的度量和離散程度的度量害幅,我在 如何做好描述統(tǒng)計(jì)分析 這篇文章中也有具體寫。
第二部分:概率的基本概念
概率的計(jì)算可以幫助我們做出有根據(jù)的決策岂昭,在 你真的了解概率嗎? 這篇文章中寫了概率計(jì)算中的一些名詞解釋等內(nèi)容狠怨。第四節(jié)內(nèi)容 概率計(jì)算 在教我們?nèi)绾斡?jì)算事件的概率约啊,概率和統(tǒng)計(jì)總是相輔相成,
至于第六節(jié)內(nèi)容 排列組合 我也把它放了進(jìn)來佣赖,這一章對階乘的計(jì)算進(jìn)行了講解恰矩,這位后續(xù)的概率分布函數(shù)提供了計(jì)算基礎(chǔ)。其實(shí)排列組合是我們初中/高中數(shù)學(xué)里都學(xué)到過了憎蛤,這里就不重點(diǎn)講它了外傅,大家知道它的表達(dá)式是什么意思以及怎么計(jì)算的就可以了。
<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;">排列組合</figcaption>
第三部分:隨機(jī)變量及其分布
本書的7俩檬、8萎胰、9節(jié)內(nèi)容在講離散型隨機(jī)變量的概率分布以及連續(xù)型隨機(jī)變量的概率分布,離散型隨機(jī)變量分布包括二項(xiàng)分布棚辽、泊松分布等技竟,連續(xù)型隨機(jī)變量分布有均勻分布、指數(shù)分布屈藐、正態(tài)分布榔组,這部分內(nèi)容在:
離散型隨機(jī)變量的概率分布
連續(xù)型隨機(jī)變量的概率分布
第四部分:抽樣
本書的第10小節(jié)內(nèi)容 統(tǒng)計(jì)抽樣的運(yùn)用 主要講樣本及抽樣的運(yùn)用。
統(tǒng)計(jì)是需要數(shù)據(jù)的联逻,那么數(shù)據(jù)從哪里來呢搓扯?這一章就是介紹在實(shí)際工作中如何正確、有效地收集數(shù)據(jù)包归。
Q:要檢查某公司生產(chǎn)的糖果質(zhì)量情況锨推,難道要把它們?nèi)汲砸槐閱幔?/p>
當(dāng)然不用,答案就是抽樣,這里先是介紹了總體和樣本的概念爱态,接著講解了一些普遍的抽樣方法谭贪,如簡單隨機(jī)抽樣,分層抽樣等锦担,以及抽樣會(huì)產(chǎn)生的誤差俭识。需要明確的是,這些抽樣方法都無法保證樣本的無偏性洞渔,但是可以將偏倚的概率降低套媚,并且樣本越大,偏倚的概率就越小磁椒。
關(guān)于總體和樣本堤瘤,在我之前的文章 簡單地聊聊統(tǒng)計(jì)學(xué) 中有寫到,大家可以點(diǎn)進(jìn)去復(fù)習(xí)下哦浆熔。
<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>
第五部分:參數(shù)估計(jì)
第11小節(jié) 總體和樣本的估計(jì) 和第12小節(jié) 置信區(qū)間的構(gòu)建 在講參數(shù)估計(jì)的知識(shí)點(diǎn)本辐。
前面說了抽樣的方法,那么我們究竟是為什么要抽樣呢医增?如果可以通過樣本推斷總體的信息慎皱,豈不是很好嗎?這就是抽樣的目的了叶骨。
參數(shù)估計(jì)是推斷統(tǒng)計(jì)的重要內(nèi)容茫多,根據(jù)樣本來推斷總體,這里經(jīng)常會(huì)提到的兩個(gè)名詞:估計(jì)量和參數(shù):
- 估計(jì)量忽刽,就是樣本的值天揖,是用來估計(jì)總體參數(shù)的統(tǒng)計(jì)量,如樣本的均值跪帝、比例等今膊,就是估計(jì)量。
- 參數(shù)伞剑,就是總體的值万细,如總體的均值。
評價(jià)估計(jì)量的標(biāo)準(zhǔn)有3個(gè):
無偏性
有效性
-
一致性
咦是不是很眼熟纸泄,要是你看過我 2020年小紅書校招數(shù)據(jù)分析筆試題 這篇文章的話赖钞,里面就有這道題,學(xué)以致用聘裁,聯(lián)動(dòng)起來雪营!
image<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>
這一章還講到了中心極限定理,中心極限定理說的是衡便,從一個(gè)非正態(tài)總體中取出一個(gè)樣本献起,如果取出的樣本足夠大洋访,那么樣本均值的分布接近正態(tài)分布。中心極限定理是非常重要的一個(gè)概念谴餐,因?yàn)樗鋵?shí)在告訴我們正態(tài)分布的重要性姻政,同時(shí)也揭露了為什么實(shí)際應(yīng)用中正態(tài)分布會(huì)那么廣泛。
和中心極限定理需要一起說明的還有大數(shù)定律岂嗓,這個(gè)我們后面再慢慢聊汁展。
剛剛是參數(shù)估計(jì)中的點(diǎn)估計(jì)方法,下面要說的是區(qū)間估計(jì)的方法厌殉。
給總體參數(shù)一個(gè)區(qū)間范圍食绿,該區(qū)間通常由樣本統(tǒng)計(jì)量加減誤差得到,這個(gè)區(qū)間就是我們說的置信區(qū)間公罕。
在構(gòu)建置信區(qū)間的步驟里有一個(gè)決定置信水平這一步器紧,什么是置信水平呢?
置信水平是你希望自己對于 置信區(qū)間包含總體統(tǒng)計(jì)量 這一說法有多大的把握楼眷。比如铲汪,我們希望總體均值的置信水平為95%,意思就是總體均值處于置信區(qū)間中的概率為0.95罐柳。
<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>
以上是這本書的部分內(nèi)容掌腰,后面還有假設(shè)檢驗(yàn)、相關(guān)與回歸等內(nèi)容硝清,假設(shè)檢驗(yàn)我是打算單獨(dú)拎出來的,所以這里就先不展開了转晰÷茫總的來說,這本書對每個(gè)知識(shí)點(diǎn)講解的很細(xì)查邢,具體到每一個(gè)公式是怎么出來的就像在給小朋友講課一樣地通過一個(gè)一個(gè)的案例讓讀者自己挖掘出來蔗崎,是一本非常不錯(cuò)的統(tǒng)計(jì)學(xué)入門書籍。
這三本書結(jié)合起來看效果會(huì)更好哦扰藕,《概率論與數(shù)理統(tǒng)計(jì)》這本書真的是非郴嚎粒基礎(chǔ)且全面了,這才是神書邓深,當(dāng)初畢業(yè)只帶了一本書未桥,就是它,命運(yùn)總是這么神奇芥备。
如需高清大圖請加我微信:data_cola