JOHN H. MCDONALD. HANDBOOK OF BIOLOLOGICAL STATISTICS. 3ed.
如何確定適當(dāng)?shù)慕y(tǒng)計(jì)測(cè)試
我發(fā)現(xiàn)系統(tǒng)的、逐步的方法是決定如何分析生物數(shù)據(jù)的最好方法。我建議您按照以下步驟操作:
- 指定你問(wèn)的生物問(wèn)題胆建。
- 以生物無(wú)效假設(shè)和備選假設(shè)的形式提出問(wèn)題返十。
- 以統(tǒng)計(jì)無(wú)效假設(shè)和備選假設(shè)的形式提出問(wèn)題庶喜。
- 確定哪些變量與問(wèn)題相關(guān)泡仗。
- 確定每個(gè)變量是什么類(lèi)型的變量番甩。
- 設(shè)計(jì)一個(gè)控制或隨機(jī)混淆變量的實(shí)驗(yàn)。
- 根據(jù)變量的數(shù)量盼玄,變量的種類(lèi)贴彼,對(duì)參數(shù)假設(shè)的預(yù)期擬合以及要測(cè)試的假設(shè),選擇使用的最佳統(tǒng)計(jì)測(cè)試埃儿。
- 如有可能器仗,進(jìn)行功效分析以確定實(shí)驗(yàn)的良好樣本量。
- 做實(shí)驗(yàn)童番。
- 檢查數(shù)據(jù)以確定它是否符合您選擇的統(tǒng)計(jì)檢驗(yàn)的假設(shè)(主要是測(cè)量變量檢驗(yàn)的正態(tài)性和同方差性)精钮。如果沒(méi)有检诗,請(qǐng)選擇更合適的測(cè)試劲赠。
- 應(yīng)用您選擇的統(tǒng)計(jì)檢驗(yàn)略板,并解釋結(jié)果顷编。
- 有效地溝通你的結(jié)果何鸡,通常用圖表或表格垢啼。
當(dāng)你按照這本教科書(shū)的方式工作時(shí)畴嘶,你會(huì)了解這個(gè)過(guò)程的不同部分溶其。你要記住的一點(diǎn)很重要:“做實(shí)驗(yàn)”是第9步筋粗,而不是第1步策橘。在做實(shí)驗(yàn)之前,你應(yīng)該做很多思考娜亿,計(jì)劃和決策丽已。如果你這樣做,你將有一個(gè)容易理解买决,易于分析和解釋的實(shí)驗(yàn)沛婴,回答你試圖回答的問(wèn)題,既不太大也不太小督赤。如果你只是想一個(gè)實(shí)驗(yàn)而不考慮如何進(jìn)行統(tǒng)計(jì)嘁灯,那么最終可能需要更復(fù)雜和更隱蔽的統(tǒng)計(jì)檢驗(yàn),得到的結(jié)果難以解釋并向其他人解釋?zhuān)部赡苁褂锰嗟牟牧希ㄒ虼死速M(fèi)你的資源)或者太少的材料(從而浪費(fèi)了整個(gè)實(shí)驗(yàn))躲舌。
以下是該過(guò)程如何工作的示例丑婿。 Verrelli和Eanes(2001)測(cè)量了果蠅個(gè)體中的糖原含量。蒼蠅在編碼磷酸葡萄糖苷酶(PGM)的遺傳基因座處具有多態(tài)性没卸。在PGM蛋白質(zhì)序列的位點(diǎn)52處羹奉,蒼蠅具有纈氨酸或丙氨酸。在現(xiàn)場(chǎng)484约计,他們有一個(gè)纈氨酸或亮氨酸诀拭。存在氨基酸(V-V,V-L煤蚌,A-V耕挨,A-L)的全部四種組合细卧。
- 一個(gè)生物學(xué)問(wèn)題是“Pgm基因座的氨基酸多態(tài)性對(duì)糖原含量有影響嗎?”生物學(xué)問(wèn)題通常是關(guān)于生物過(guò)程的東西筒占,通常以“變化的X會(huì)導(dǎo)致Y的變化酒甸?”的形式出現(xiàn)。你可能想知道藥物是否會(huì)改變血壓;土壤pH值是否影響藍(lán)莓灌木叢的生長(zhǎng);或蛋白質(zhì)Rab10是否介導(dǎo)膜轉(zhuǎn)運(yùn)成纖毛赋铝。
- 生物無(wú)效假說(shuō)是“不同的氨基酸序列不影響PGM的生化性質(zhì)插勤,所以糖原含量不受PGM序列的影響「锕牵”生物替代假說(shuō)是“不同的氨基酸序列確實(shí)影響PGM的生化性質(zhì)农尖,所以糖原含量受PGM序列的影響×颊埽”通過(guò)思考生物無(wú)效和備選假設(shè)盛卡,你可以確保你的實(shí)驗(yàn)?zāi)軌驗(yàn)槟愕纳飭?wèn)題的不同答案提供不同的結(jié)果。
- 統(tǒng)計(jì)零假設(shè)是“具有不同PGM酶序列的蒼蠅具有相同的平均糖原含量”筑凫。另一種假設(shè)是“具有不同PGM序列的蒼蠅具有不同的平均糖原含量”滑沧。雖然生物無(wú)效假設(shè)和替代假設(shè)是關(guān)于生物過(guò)程的,但統(tǒng)計(jì)無(wú)效假設(shè)和替代假設(shè)都是關(guān)于數(shù)字的;在這種情況下巍实,糖原含量可以相同或不同滓技。測(cè)試你的統(tǒng)計(jì)零假設(shè)是本手冊(cè)的主要內(nèi)容,它應(yīng)該給你一個(gè)明確的答案;您將拒絕或接受統(tǒng)計(jì)null棚潦。是否拒絕統(tǒng)計(jì)無(wú)效假設(shè)是有足夠的證據(jù)來(lái)回答你的生物問(wèn)題可能是一個(gè)更困難令漂,更主觀(guān)的決定;你的結(jié)果可能有其他可能的解釋?zhuān)阕鳛樯飳W(xué)專(zhuān)業(yè)領(lǐng)域的專(zhuān)家將不得不考慮它們的合理性。
- Verrelli和Eanes實(shí)驗(yàn)中的兩個(gè)相關(guān)變量是糖原含量和PGM序列丸边。
- 糖原含量是一個(gè)測(cè)量變量叠必,可以記錄為可能有許多可能值的數(shù)字。蒼蠅所具有的PGM序列(V-V妹窖,V-L纬朝,A-V或A-L)是標(biāo)稱(chēng)變量,通常記錄為單詞的可能值較少(在本例中為四個(gè))骄呼。
- 可能很重要的其他變量共苛,如年齡和蠅蛹在小瓶中的位置被控制(使用所有相同年齡的蒼蠅)或隨機(jī)分配(從小瓶中隨機(jī)取出蒼蠅,不考慮它們?cè)谀睦锿懫ぃ┶寺蟆R灿锌赡苡^(guān)察混雜變量;例如俄讹,Verrelli和Eanes可以使用不同年齡的蒼蠅哆致,然后使用統(tǒng)計(jì)技術(shù)調(diào)整年齡绕德。這可能會(huì)使分析變得更加復(fù)雜并且更難以解釋?zhuān)M管它可能會(huì)提出有關(guān)年齡和糖原含量的一些有趣的內(nèi)容,但它不會(huì)幫助解決有關(guān)PGM基因型和糖原含量的主要生物問(wèn)題摊阀。
- 因?yàn)槟繕?biāo)是比較一個(gè)名義變量組中的一個(gè)測(cè)量變量的均值耻蛇,并且有兩個(gè)以上的類(lèi)別踪蹬,所以適當(dāng)?shù)慕y(tǒng)計(jì)測(cè)試是單向anova。一旦你知道你正在分析哪些變量以及它們是什么類(lèi)型臣咖,可能的統(tǒng)計(jì)測(cè)試數(shù)量通常限制在一到兩個(gè)(至少對(duì)于本手冊(cè)中的測(cè)試)跃捣。
- 功效分析需要對(duì)糖原含量的標(biāo)準(zhǔn)偏差進(jìn)行估計(jì),這可能在已發(fā)表的文獻(xiàn)中可以找到夺蛇,而效應(yīng)大小的數(shù)字(實(shí)驗(yàn)人員想要檢測(cè)的基因型中糖原含量的變化)疚漆。在這個(gè)實(shí)驗(yàn)中,基因型之間糖原含量的任何差異都會(huì)很有趣刁赦,所以實(shí)驗(yàn)者只是在可用時(shí)間內(nèi)盡可能多地使用蒼蠅娶聘。
- 實(shí)驗(yàn)完成:用不同的PGM序列在蒼蠅中測(cè)量糖原含量。
- anova假設(shè)測(cè)量變量糖原含量正常(分布符合鐘形正態(tài)曲線(xiàn))和同方差(不同PGM序列中糖原含量的變化相等)甚脉,并檢查數(shù)據(jù)的直方圖顯示數(shù)據(jù)符合這些假設(shè)丸升。如果數(shù)據(jù)不符合anova的假設(shè),那么Kruskal牺氨?allis測(cè)試或Welch測(cè)試可能會(huì)更好狡耻。
- 使用電子表格,網(wǎng)頁(yè)或計(jì)算機(jī)程序完成單向anova猴凹,并且anova的結(jié)果是P值小于0.05夷狰。 其解釋是具有一些PGM序列的蒼蠅具有與其他PGM序列蒼蠅不同的平均糖原含量。
- 結(jié)果可以總結(jié)在一個(gè)表格中郊霎,但更有效的溝通方式是使用圖表孵淘。