商業(yè)分析第六次課作業(yè)-0812(到底是誰(shuí)的肱骨5癜肌)

感謝Dr.fish的耐心講解和細(xì)致回答殴俱。

本次課的隨堂作業(yè)如下:

同一類(lèi)動(dòng)物的肱骨大概具有相同的長(zhǎng)寬比,考古學(xué)家根據(jù)這一性質(zhì)來(lái)鑒定物種枚抵∠哂考古學(xué)家發(fā)掘了41塊肱骨化石,假設(shè)它們來(lái)自于同一物種俄精,判斷它們是不是物種A(已知物種A的肱骨長(zhǎng)寬比為8.5)询筏。取α=0.01。

進(jìn)階作業(yè)為:

使用計(jì)算機(jī)模擬方法計(jì)算課堂作業(yè)


直接上代碼

# 導(dǎo)入分析包

import numpy as np
import pandas as pd
import scipy.stats 

# 加載數(shù)據(jù)

data = [10.73, 8.89, 9.07, 9.20, 10.33, 9.98, 9.84, 9.59, 8.48, 8.71, 9.57, 9.29, 9.94, 8.07, 8.37, 6.85, 8.52, 8.87, 6.23, 9.41, 
  6.66, 9.35, 8.86, 9.93, 8.91, 11.77, 10.48, 10.39, 9.39, 9.17, 9.89, 8.17, 8.93, 8.80, 10.02, 8.38, 11.67, 8.30, 9.17, 12.00, 9.38]

課堂作業(yè)解題思路

  1. 僅有一組數(shù)據(jù)竖慧,故排除配對(duì)及雙樣本檢驗(yàn)嫌套;
  2. 非整體數(shù)據(jù),故排除z檢驗(yàn)圾旨;
  3. 最終選擇t檢驗(yàn)踱讨。
t statisic

手工計(jì)算過(guò)程:

  1. 設(shè)置原假設(shè)和備擇假設(shè)
原假設(shè) 及 備擇假設(shè)
檢驗(yàn)分布圖
  1. 計(jì)算t統(tǒng)計(jì)量

1. 隨堂作業(yè)部分

方法一:手工計(jì)算單樣本 t 檢驗(yàn)

# 計(jì)算 t 統(tǒng)計(jì)量
mean = np.mean(data)
n = len(data)
t_statistics = (mean - 8.5) / (np.std(data, ddof = 1) / np.sqrt(n)) 
t_statistics

# 輸出結(jié)果
4.0303238468687361
# 計(jì)算 t 臨界值
# alpha = 0.01, 雙邊檢驗(yàn)砍的,取α/2
t_critical = scipy.stats.t.isf(0.01 / 2 , df = n - 1)
t_critical

# 輸出結(jié)果
2.7044592674331502
#計(jì)算 p 值驗(yàn)證下 
p_value = scipy.stats.t.sf(t_statistics, df = n - 1) * 2 # 雙邊檢驗(yàn)p值×2
p_value

# 輸出結(jié)果
0.00024267304119873163

方法二:使用 scipy.stats.ttest_1samp()計(jì)算單樣本 t 檢驗(yàn)計(jì)算

t_statistics, p_value = scipy.stats.ttest_1samp(data, 8.5) 

t_statistics, p_value

# 輸出結(jié)果
(4.030323846868737, 0.00024267304119873163)

結(jié)論
當(dāng)置信度水平α取0.01時(shí)痹筛,因?yàn)?t_statistics > t_critical (或者 p_value < α) , t統(tǒng)計(jì)量落在拒絕域中,所以拒絕原假設(shè),樣本不是物種A帚稠。


2. 進(jìn)階作業(yè) - bootstrap 方法

bootstrap解題思路

bootstrap為有放回抽樣谣旁,所以需要:

  1. 定義一個(gè)單次抽樣計(jì)算P值函數(shù)
  2. 定義一個(gè)重復(fù)抽樣并計(jì)算p值均值的函數(shù)
  3. 輸入抽樣次數(shù)
# 第一種方法 -- 公式手算

# 定義一個(gè)單次抽樣并計(jì)算P值的函數(shù),并返回單次抽樣的P值
def bs_replicate_1d(data): 
    
    bs_replicate_1d = np.random.choice(data, size=len(data))
    stats_mean = np.mean(bs_replicate_1d)
    stats_n = len(bs_replicate_1d)
    
    t_statistics = (stats_mean - 8.5) / (np.std(bs_replicate_1d, ddof = 1) / np.sqrt(stats_n)) #計(jì)算t統(tǒng)計(jì)量
    stats_p = scipy.stats.t.sf(t_statistics, df = stats_n - 1) * 2
    
    return stats_p  


# 定義一個(gè)重復(fù)抽樣并計(jì)算p值均值的函數(shù)滋早,返回p值的均值
def draw_bs_reps(data, size=1):
    bs_replicates = np.empty(size)  # 初始一個(gè)空數(shù)組
    
    # 進(jìn)行多次重新抽樣
    for i in range(size):   
        bs_replicates[i] = bs_replicate_1d(data)  
    
    p_value = sum(bs_replicates) / size
    
    return p_value  


# 重復(fù)抽樣10000次
draw_bs_reps(data, size=1000)

# 輸出結(jié)果
0.0057400175854891624

# 第二種方法 -- 套函數(shù)

def bs_replicate_1d(data): 
    
    bs_replicate_1d = np.random.choice(data, size=len(data))
    t_statistics, stats_p = scipy.stats.ttest_1samp(bs_replicate_1d, 8.5)
    stats_p = stats_p
    
       
    return stats_p  


# 定義一個(gè)重復(fù)抽樣并計(jì)算p值均值的函數(shù)榄审,返回p值的均值
def draw_bs_reps(data, size=1):
    bs_replicates = np.empty(size)  # 初始一個(gè)空數(shù)組
    
    # 進(jìn)行多次重新抽樣
    for i in range(size):   
        bs_replicates[i] = bs_replicate_1d(data)  
    
    p_value = sum(bs_replicates) / size
    
    return p_value  


# 重復(fù)抽樣10000次
draw_bs_reps(data, size=1000)

# 輸出結(jié)果
0.0045788518825149857

不曉得為什么用計(jì)算機(jī)模擬算出來(lái)的p值會(huì)比用樣本數(shù)據(jù)算出來(lái)的大(雖然也是落在拒絕域內(nèi)吧……)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市杆麸,隨后出現(xiàn)的幾起案子搁进,更是在濱河造成了極大的恐慌,老刑警劉巖昔头,帶你破解...
    沈念sama閱讀 219,539評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件饼问,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡揭斧,警方通過(guò)查閱死者的電腦和手機(jī)莱革,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,594評(píng)論 3 396
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)讹开,“玉大人驮吱,你說(shuō)我怎么就攤上這事∠舴停” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,871評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵桐筏,是天一觀的道長(zhǎng)纸型。 經(jīng)常有香客問(wèn)我,道長(zhǎng)梅忌,這世上最難降的妖魔是什么狰腌? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,963評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮牧氮,結(jié)果婚禮上琼腔,老公的妹妹穿的比我還像新娘。我一直安慰自己踱葛,他們只是感情好丹莲,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,984評(píng)論 6 393
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著尸诽,像睡著了一般甥材。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上性含,一...
    開(kāi)封第一講書(shū)人閱讀 51,763評(píng)論 1 307
  • 那天洲赵,我揣著相機(jī)與錄音,去河邊找鬼。 笑死叠萍,一個(gè)胖子當(dāng)著我的面吹牛芝发,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播苛谷,決...
    沈念sama閱讀 40,468評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼辅鲸,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了抄腔?” 一聲冷哼從身側(cè)響起瓢湃,我...
    開(kāi)封第一講書(shū)人閱讀 39,357評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎赫蛇,沒(méi)想到半個(gè)月后绵患,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,850評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡悟耘,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,002評(píng)論 3 338
  • 正文 我和宋清朗相戀三年落蝙,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片暂幼。...
    茶點(diǎn)故事閱讀 40,144評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡筏勒,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出旺嬉,到底是詐尸還是另有隱情管行,我是刑警寧澤,帶...
    沈念sama閱讀 35,823評(píng)論 5 346
  • 正文 年R本政府宣布邪媳,位于F島的核電站捐顷,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏雨效。R本人自食惡果不足惜迅涮,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,483評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望徽龟。 院中可真熱鬧叮姑,春花似錦、人聲如沸据悔。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,026評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)屠尊。三九已至旷祸,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間讼昆,已是汗流浹背托享。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,150評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工骚烧, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人闰围。 一個(gè)月前我還...
    沈念sama閱讀 48,415評(píng)論 3 373
  • 正文 我出身青樓赃绊,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親羡榴。 傳聞我的和親對(duì)象是個(gè)殘疾皇子碧查,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,092評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容