每個(gè)人談到統(tǒng)計(jì)學(xué),都會(huì)有著不同的理解。
在剛接觸統(tǒng)計(jì)學(xué)時(shí)羡藐,我也思考過對(duì)統(tǒng)計(jì)學(xué)中的概念進(jìn)行定義是否有必要,后來隨著統(tǒng)計(jì)學(xué)學(xué)習(xí)的深入悯许,單純把概念用幾句話講清楚實(shí)在是太浪費(fèi)時(shí)間仆嗦。如果在一開始就明確定義達(dá)成共識(shí),這將會(huì)在后期的學(xué)習(xí)中極大地提高效率先壕。
1. 到底什么是統(tǒng)計(jì)學(xué)瘩扼?
統(tǒng)計(jì)學(xué):收集、處理垃僚、分析集绰、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。
統(tǒng)計(jì)學(xué)又分描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)冈在。描述統(tǒng)計(jì)是指數(shù)據(jù)收集倒慧、處理、匯總包券、圖表描述纫谅、概括與分析等統(tǒng)計(jì)方法。比如從供應(yīng)商溅固、渠道等角度統(tǒng)計(jì)比較某段時(shí)間的銷售量付秕。推斷統(tǒng)計(jì)指如何利用樣本數(shù)據(jù)來推斷總體特征等統(tǒng)計(jì)方法。像根據(jù)近五年的數(shù)據(jù)預(yù)測明年的銷售量等侍郭。
在我接觸到的數(shù)據(jù)分析小伙伴中询吴,大多數(shù)分析師的工作集中在描述統(tǒng)計(jì),這其中還衍生出了數(shù)據(jù)可視化工程師亮元,專門負(fù)責(zé)數(shù)據(jù)的可視化展現(xiàn)猛计。而在推斷分析中,分析師的水平參差不齊爆捞,所用的方法也五花八門奉瘤,在后面的學(xué)習(xí)中會(huì)有具體的涉及,不做展開煮甥。
2. 統(tǒng)計(jì)數(shù)據(jù)的類型
(1)按計(jì)量尺度分:分類數(shù)據(jù)盗温、順序數(shù)據(jù)藕赞、數(shù)值型數(shù)據(jù)。分類數(shù)據(jù)和順序數(shù)據(jù)主要以文字的形式卖局,也稱定性數(shù)據(jù)或品質(zhì)數(shù)據(jù)斧蜕。數(shù)值型數(shù)據(jù)也成為定量數(shù)據(jù)或數(shù)量數(shù)據(jù)。定性數(shù)據(jù)與定量數(shù)據(jù)在用戶研究和數(shù)據(jù)分析中均起到了重要的作用砚偶,在業(yè)務(wù)的需求上也能相互補(bǔ)充和論證批销。
(2)按收集方法分:觀測數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)。觀測數(shù)據(jù)主要是調(diào)查或觀測得來的數(shù)據(jù)蟹演,沒有人為控制风钻。實(shí)驗(yàn)數(shù)據(jù)是在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象收集的。
(3)按與時(shí)間的關(guān)系分:截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)酒请。截面數(shù)據(jù)是在相同時(shí)間點(diǎn)上的靜態(tài)數(shù)據(jù),時(shí)間序列數(shù)據(jù)是在不同時(shí)間上收集的數(shù)據(jù)鸣个,描述了對(duì)象隨時(shí)間變化的情況羞反。
3. 幾個(gè)基本概念
(1)總體:包含研究個(gè)體的集合,一般統(tǒng)計(jì)學(xué)上的總體是針對(duì)無限總體的囤萤,因此也把總體看做隨機(jī)變量昼窗。
(2)樣本:總體中抽取一部分元素的集合。元素的數(shù)量稱為樣本量涛舍。
(3)參數(shù):描述總體特征的概括性數(shù)字度量澄惊。如總體平均數(shù)、總體標(biāo)準(zhǔn)差富雅、總體比例等掸驱。
(4)統(tǒng)計(jì)量:描述樣本特征的概括性數(shù)字度量。如樣本平均數(shù)没佑、樣本標(biāo)準(zhǔn)差毕贼、樣本比例等。
(5)變量:說明現(xiàn)象的某種特征蛤奢,具體的取值稱為變量值鬼癣。例如:銷售額20萬元。銷售額為變量啤贩,20萬元為變量值待秃。變量的分類分成分類變量、順序變量和數(shù)值型變量痹屹,其中數(shù)值型變量又分為離散型和連續(xù)性章郁。這與按計(jì)量單位分類的統(tǒng)計(jì)數(shù)據(jù)是統(tǒng)一的。
了解了統(tǒng)計(jì)學(xué)是什么痢掠,接下來就可以更清楚地理解描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)了:)