大數(shù)法則與中心極限定理
一、課堂內(nèi)容
1.大數(shù)法則的概念
(1)如果選擇正確的統(tǒng)計(jì)量進(jìn)行參數(shù)估算霹肝,樣本量越大,統(tǒng)計(jì)量越接近參數(shù)塑煎;
(2)總體的方差沫换、標(biāo)準(zhǔn)差等參數(shù)是不變的固定值;
(3)但隨著對(duì)總體的不同抽樣最铁,統(tǒng)計(jì)量會(huì)發(fā)生變化讯赏。
2.中心極限定理的概念
(1)樣本容量足夠大,平均數(shù)的抽樣分布越接近正態(tài)分布冷尉。
(2)中心極限定理不適用所有的抽樣漱挎。適用范圍包括但不限于:樣本平均數(shù);樣本比例雀哨;樣本平均數(shù)的差異磕谅;樣本比例的差異等。
二雾棺、練習(xí)內(nèi)容
大數(shù)法則的練習(xí)比較簡(jiǎn)單膊夹,就沒(méi)有做筆記,這里主要是中心極限定理的兩個(gè)練習(xí)捌浩。
1.第一組練習(xí)
使用樣本量為3做實(shí)驗(yàn)放刨。
a. 使用 numpy 的 random.choice 模擬從 pop_data 數(shù)組中進(jìn)行3次取樣
test_1 = np.random.choice(pop_data, 3)
b. 計(jì)算這3次取樣的平均值
(test_1).mean()
c. 編寫(xiě)一個(gè)循環(huán)10,000次的程序來(lái)模擬這個(gè)過(guò)程,并將每個(gè)均值存儲(chǔ)到一個(gè)名為 means_size_3 的數(shù)組中
means_size_3 = []
for _ in range(10000):
test_1 = np.random.choice(pop_data, 3)
means_size_3.append(test_1.mean())
d. 繪制一個(gè)樣本均值直方圖
plt.hist(means_size_3)
e. 使用 means_size_3 與 pop_data 回答下面的測(cè)試題目
抽樣分布的平均數(shù):
sum = 0
for item in means_size_3:
sum += item
print(sum / len(means_size_3))
或者將list轉(zhuǎn)為array可以直接使用mean函數(shù)
means_size_3 = np.array(means_size_3)
(means_size_3).mean()
總體平均數(shù):
(pop_data).mean()
總體標(biāo)準(zhǔn)差:
(pop_data).std()
抽樣分布標(biāo)準(zhǔn)差:
(means_size_3).std()
2.第二組練習(xí)
使用樣本容量為100做實(shí)驗(yàn)尸饺。
流程和上面一樣进统,將3改為100即可助币,不再重復(fù)。
三螟碎、總結(jié)
這部分課程內(nèi)容中一直在提一個(gè)概念叫做樣本量足夠大才能獲得最接近參數(shù)的統(tǒng)計(jì)值眉菱,那么多少樣本容量叫做樣本足夠大呢?課程中未解釋?zhuān)M竺娴膬?nèi)容會(huì)提及抚芦。
這是Udacity數(shù)據(jù)分析(入門(mén))課程的統(tǒng)計(jì)學(xué)lesson10的學(xué)習(xí)筆記二
Lesson10的課程學(xué)習(xí)結(jié)束
轉(zhuǎn)載請(qǐng)注明出處