統(tǒng)計學是數(shù)據(jù)分析的重要基礎和核心工具伊脓,是數(shù)據(jù)分析師必須掌握的一門知識碗短。統(tǒng)計,通過某種有意義的方式對原始信息或數(shù)字進行提煉悦陋,挖掘其背后的價值蜈彼。為什么要學習統(tǒng)計學?它可以精確的幫助預測俺驶,以及以最有效的方式表達自己的信息幸逆。以下分別從統(tǒng)計研究步驟、統(tǒng)計學要點暮现、直方圖實踐等方面介紹統(tǒng)計學入門的一些基礎知識还绘。
一?統(tǒng)計研究的三個步驟
1 搜集數(shù)據(jù),統(tǒng)計的根本在于數(shù)據(jù)栖袋,常用的搜集方法有拍顷,查看現(xiàn)有數(shù)據(jù)源(從數(shù)據(jù)網(wǎng)站、競爭對手數(shù)據(jù)或公司內(nèi)部數(shù)據(jù))塘幅、做實驗及調(diào)查等昔案。
2?分析尿贫,對搜集好的數(shù)據(jù)進行分析,得出統(tǒng)計量爱沟∷可以計算事件概率匆背,預測某些事件發(fā)生的可能性呼伸,或了解某些結(jié)果的置信度。
3?做結(jié)論钝尸,完成數(shù)據(jù)分析括享,將其以圖形化展示。
二?統(tǒng)計學一些要點
1?頻數(shù)珍促,是一種統(tǒng)計方法铃辖,用于描述一個列別中有多少個項
2?餅圖能很好體現(xiàn)基本比例和各部分占比的比較
3?數(shù)據(jù)分為數(shù)值型數(shù)據(jù)和類別數(shù)據(jù),數(shù)值型數(shù)據(jù)涉及的是數(shù)字和數(shù)量猪叙,如一個班級年齡為20歲有多少人娇斩,較適合用垂直條形圖展示;類別數(shù)據(jù)涉及的是表述和質(zhì)量穴翩,如一個班級男生人數(shù)有多少人犬第,適合用水平條形圖展示,尤其是類別名稱太長的時候芒帕。
4?累積頻數(shù)歉嗓,即到某個特定數(shù)值為止的總頻數(shù),頻數(shù)的累計總和
5?折線圖適合展示數(shù)據(jù)的趨勢變化背蟆,具有較好的預測作用鉴分。但不要用于展示類別數(shù)據(jù)。同時带膀,一幅圖可以添加多個折線圖志珍。
三?統(tǒng)計學里的直方圖實踐
直方圖和條形圖不同,各長方形沒有間隔且面積代表頻數(shù)垛叨〔耆梗·繪制直方圖一般有三個步驟:
(1)求長方形寬度
(2)求長方形高度
(3)畫出直方圖
以下表格為玩家每日玩網(wǎng)絡游戲的小時數(shù)。
分別求出直方圖的寬度和高度:
根據(jù)寬度和高度点额,繪制出直方圖如下舔株。
四?總結(jié)
雖然在高中、大學和研究生階段都不斷在學習統(tǒng)計學知識还棱,如幾何學载慈、概率論等。但當真正要用于工作中珍手,用于解決問題時办铡,仍然一籌莫展辞做。在《深入淺出統(tǒng)計學》帶領下,從實際案例再次系統(tǒng)學些統(tǒng)計學寡具,為數(shù)據(jù)分析打下堅實的基礎秤茅。下篇預告《產(chǎn)品新人學統(tǒng)計學第二課—均值、中位數(shù)童叠、眾數(shù)框喳,傻傻分不清楚》。