商業(yè)分析第六次課作業(yè)-0812（到底是誰(shuí)的肱骨５癜肌）

感謝Dr.fish的耐心講解和細(xì)致回答殴俱。

本次課的隨堂作業(yè)如下：

同一類(lèi)動(dòng)物的肱骨大概具有相同的長(zhǎng)寬比，考古學(xué)家根據(jù)這一性質(zhì)來(lái)鑒定物種枚抵∠哂考古學(xué)家發(fā)掘了41塊肱骨化石，假設(shè)它們來(lái)自于同一物種俄精，判斷它們是不是物種A（已知物種A的肱骨長(zhǎng)寬比為8.5）询筏。取α=0.01。

進(jìn)階作業(yè)為：

使用計(jì)算機(jī)模擬方法計(jì)算課堂作業(yè)

直接上代碼

# 導(dǎo)入分析包

import numpy as np
import pandas as pd
import scipy.stats 

# 加載數(shù)據(jù)

data = [10.73, 8.89, 9.07, 9.20, 10.33, 9.98, 9.84, 9.59, 8.48, 8.71, 9.57, 9.29, 9.94, 8.07, 8.37, 6.85, 8.52, 8.87, 6.23, 9.41, 
  6.66, 9.35, 8.86, 9.93, 8.91, 11.77, 10.48, 10.39, 9.39, 9.17, 9.89, 8.17, 8.93, 8.80, 10.02, 8.38, 11.67, 8.30, 9.17, 12.00, 9.38]

課堂作業(yè)解題思路

僅有一組數(shù)據(jù)竖慧，故排除配對(duì)及雙樣本檢驗(yàn)嫌套；
非整體數(shù)據(jù)，故排除z檢驗(yàn)圾旨；
最終選擇t檢驗(yàn)踱讨。

t statisic

手工計(jì)算過(guò)程：

設(shè)置原假設(shè)和備擇假設(shè)

原假設(shè) 及備擇假設(shè)

檢驗(yàn)分布圖

計(jì)算t統(tǒng)計(jì)量

1. 隨堂作業(yè)部分

方法一：手工計(jì)算單樣本 t 檢驗(yàn)

# 計(jì)算 t 統(tǒng)計(jì)量
mean = np.mean(data)
n = len(data)
t_statistics = (mean - 8.5) / (np.std(data, ddof = 1) / np.sqrt(n)) 
t_statistics

# 輸出結(jié)果
4.0303238468687361

# 計(jì)算 t 臨界值
# alpha = 0.01， 雙邊檢驗(yàn)砍的，取α/2
t_critical = scipy.stats.t.isf(0.01 / 2 , df = n - 1)
t_critical

# 輸出結(jié)果
2.7044592674331502

#計(jì)算 p 值驗(yàn)證下 
p_value = scipy.stats.t.sf(t_statistics, df = n - 1) * 2 # 雙邊檢驗(yàn)p值×2
p_value

# 輸出結(jié)果
0.00024267304119873163

方法二：使用 scipy.stats.ttest_1samp()計(jì)算單樣本 t 檢驗(yàn)計(jì)算

t_statistics, p_value = scipy.stats.ttest_1samp(data, 8.5) 

t_statistics, p_value

# 輸出結(jié)果
(4.030323846868737, 0.00024267304119873163)

結(jié)論
當(dāng)置信度水平α取0.01時(shí)痹筛，因?yàn)?t_statistics > t_critical (或者 p_value < α) , t統(tǒng)計(jì)量落在拒絕域中，所以拒絕原假設(shè)，樣本不是物種A帚稠。

2. 進(jìn)階作業(yè) - bootstrap 方法

bootstrap解題思路

bootstrap為有放回抽樣谣旁，所以需要：

定義一個(gè)單次抽樣計(jì)算P值函數(shù)
定義一個(gè)重復(fù)抽樣并計(jì)算p值均值的函數(shù)
輸入抽樣次數(shù)

# 第一種方法 -- 公式手算

# 定義一個(gè)單次抽樣并計(jì)算P值的函數(shù)，并返回單次抽樣的P值
def bs_replicate_1d(data): 
    
    bs_replicate_1d = np.random.choice(data, size=len(data))
    stats_mean = np.mean(bs_replicate_1d)
    stats_n = len(bs_replicate_1d)
    
    t_statistics = (stats_mean - 8.5) / (np.std(bs_replicate_1d, ddof = 1) / np.sqrt(stats_n)) #計(jì)算t統(tǒng)計(jì)量
    stats_p = scipy.stats.t.sf(t_statistics, df = stats_n - 1) * 2
    
    return stats_p  


# 定義一個(gè)重復(fù)抽樣并計(jì)算p值均值的函數(shù)滋早，返回p值的均值
def draw_bs_reps(data, size=1):
    bs_replicates = np.empty(size)  # 初始一個(gè)空數(shù)組
    
    # 進(jìn)行多次重新抽樣
    for i in range(size):   
        bs_replicates[i] = bs_replicate_1d(data)  
    
    p_value = sum(bs_replicates) / size
    
    return p_value  


# 重復(fù)抽樣10000次
draw_bs_reps(data, size=1000)

# 輸出結(jié)果
0.0057400175854891624

# 第二種方法 -- 套函數(shù)

def bs_replicate_1d(data): 
    
    bs_replicate_1d = np.random.choice(data, size=len(data))
    t_statistics, stats_p = scipy.stats.ttest_1samp(bs_replicate_1d, 8.5)
    stats_p = stats_p
    
       
    return stats_p  


# 定義一個(gè)重復(fù)抽樣并計(jì)算p值均值的函數(shù)榄审，返回p值的均值
def draw_bs_reps(data, size=1):
    bs_replicates = np.empty(size)  # 初始一個(gè)空數(shù)組
    
    # 進(jìn)行多次重新抽樣
    for i in range(size):   
        bs_replicates[i] = bs_replicate_1d(data)  
    
    p_value = sum(bs_replicates) / size
    
    return p_value  


# 重復(fù)抽樣10000次
draw_bs_reps(data, size=1000)

# 輸出結(jié)果
0.0045788518825149857

不曉得為什么用計(jì)算機(jī)模擬算出來(lái)的p值會(huì)比用樣本數(shù)據(jù)算出來(lái)的大（雖然也是落在拒絕域內(nèi)吧……）

最后編輯于：2017.12.10 02:30:48

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市杆麸，隨后出現(xiàn)的幾起案子搁进，更是在濱河造成了極大的恐慌，老刑警劉巖昔头，帶你破解...
沈念sama閱讀 219,539評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件饼问，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡揭斧，警方通過(guò)查閱死者的電腦和手機(jī)莱革，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,594評(píng)論 3贊 396
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)讹开，“玉大人驮吱，你說(shuō)我怎么就攤上這事∠舴停” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 165,871評(píng)論 0贊 356
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵桐筏，是天一觀的道長(zhǎng)纸型。經(jīng)常有香客問(wèn)我，道長(zhǎng)梅忌，這世上最難降的妖魔是什么狰腌？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,963評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮牧氮，結(jié)果婚禮上琼腔，老公的妹妹穿的比我還像新娘。我一直安慰自己踱葛，他們只是感情好丹莲，可當(dāng)我...
茶點(diǎn)故事閱讀 67,984評(píng)論 6贊 393
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著尸诽，像睡著了一般甥材。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上性含，一...
開(kāi)封第一講書(shū)人閱讀 51,763評(píng)論 1贊 307
城市分裂傳說(shuō)
那天洲赵，我揣著相機(jī)與錄音，去河邊找鬼。笑死叠萍，一個(gè)胖子當(dāng)著我的面吹牛芝发，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播苛谷，決...
沈念sama閱讀 40,468評(píng)論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼辅鲸，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了抄腔？” 一聲冷哼從身側(cè)響起瓢湃，我...
開(kāi)封第一講書(shū)人閱讀 39,357評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎赫蛇，沒(méi)想到半個(gè)月后绵患，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,850評(píng)論 1贊 317
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡悟耘，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 38,002評(píng)論 3贊 338
?白月光啟示錄
正文我和宋清朗相戀三年落蝙，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片暂幼。...
茶點(diǎn)故事閱讀 40,144評(píng)論 1贊 351
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡筏勒，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出旺嬉，到底是詐尸還是另有隱情管行，我是刑警寧澤，帶...
沈念sama閱讀 35,823評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布邪媳，位于F島的核電站捐顷，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏雨效。R本人自食惡果不足惜迅涮，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,483評(píng)論 3贊 331
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望徽龟。院中可真熱鬧叮姑，春花似錦、人聲如沸据悔。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 32,026評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)屠尊。三九已至旷祸，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間讼昆，已是汗流浹背托享。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,150評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工骚烧，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人闰围。一個(gè)月前我還...
沈念sama閱讀 48,415評(píng)論 3贊 373
代替公主和親
正文我出身青樓赃绊，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親羡榴。傳聞我的和親對(duì)象是個(gè)殘疾皇子碧查，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,092評(píng)論 2贊 355

商業(yè)分析第六次課作業(yè)-0812（到底是誰(shuí)的肱骨！）

商業(yè)分析第六次課作業(yè)-0812（到底是誰(shuí)的肱骨５癜肌）

推薦閱讀更多精彩內(nèi)容