StatQuest生物統(tǒng)計(jì)學(xué)專題 - 生物重復(fù)和技術(shù)重復(fù)

生物重復(fù)和技術(shù)重復(fù)分別是什么火欧?在一個(gè)實(shí)驗(yàn)中應(yīng)該如何安排生物重復(fù)和技術(shù)重復(fù)衷畦?

重復(fù)是實(shí)驗(yàn)設(shè)計(jì)的重要原則之一妇斤,實(shí)驗(yàn)重復(fù)無(wú)論對(duì)于實(shí)驗(yàn)結(jié)果的可重復(fù)性摇锋,還是對(duì)于最終實(shí)驗(yàn)結(jié)論的可靠性丹拯,都起著起決定性的作用。

實(shí)驗(yàn)重復(fù)還可以進(jìn)一步細(xì)分為生物重復(fù)(biological replicates)和技術(shù)重復(fù)(technical replicates)荸恕,那么生物重復(fù)和技術(shù)重復(fù)分別是什么乖酬?在一個(gè)實(shí)驗(yàn)中應(yīng)該如何安排生物重復(fù)和技術(shù)重復(fù)?

生物重復(fù)和技術(shù)重復(fù)分別是什么融求?

生物重復(fù):指對(duì)同一個(gè)處理組中獨(dú)立來(lái)源的重復(fù)樣本分別進(jìn)行獨(dú)立分析咬像,是整個(gè)實(shí)驗(yàn)的完全重復(fù),如將具有同一基因型的多個(gè)細(xì)胞株進(jìn)行獨(dú)立地測(cè)定生宛。由于遺傳和環(huán)境等因素的影響會(huì)引起有機(jī)體的個(gè)體差異县昂,因此需要采用生物重復(fù)的實(shí)驗(yàn)設(shè)計(jì)方法來(lái)消除該差異。目前都以3次生物學(xué)重復(fù)實(shí)驗(yàn)設(shè)計(jì)為主陷舅,要求嚴(yán)格的實(shí)驗(yàn)可以做5次重復(fù)倒彰。

技術(shù)重復(fù):指對(duì)同一樣本進(jìn)行重復(fù)地檢測(cè)分析,例如同一份細(xì)胞中抽提的蛋白質(zhì)進(jìn)行三次質(zhì)譜檢測(cè)莱睁,或者對(duì)同一RNA-seq樣本測(cè)序3次待讳。與生物學(xué)重復(fù)相比,技術(shù)重復(fù)的測(cè)量變異程度較小仰剿,從而可以減少實(shí)驗(yàn)中的分析變異创淡,將對(duì)同一份樣本產(chǎn)生高重復(fù)性的測(cè)量結(jié)果 。

簡(jiǎn)單來(lái)講南吮,生物重復(fù)是生物級(jí)別的重復(fù)辩昆,一般都是生物樣本的重復(fù)。而技術(shù)重復(fù)旨袒,更多的是參數(shù)測(cè)定環(huán)節(jié)的重復(fù)汁针,一般是對(duì)同一生物樣本進(jìn)行多次測(cè)定。

進(jìn)一步分析砚尽,其實(shí)可以發(fā)現(xiàn)生物重復(fù)是衡量實(shí)驗(yàn)的總波動(dòng)的(處理組間的差異不列入此處的波動(dòng)施无,他們應(yīng)該稱為效應(yīng)),它包括樣本個(gè)體間差異和技術(shù)重復(fù)差異必孤,而技術(shù)重復(fù)更多的是單純的衡量參數(shù)測(cè)量時(shí)的波動(dòng)猾骡,如實(shí)驗(yàn)操作嫻熟程度、儀器穩(wěn)定性等等敷搪。

在一個(gè)實(shí)驗(yàn)中應(yīng)該如何安排生物重復(fù)和技術(shù)重復(fù)兴想?

如此說(shuō)來(lái),對(duì)于一個(gè)實(shí)驗(yàn)來(lái)說(shuō)赡勘,如果條件允許的話嫂便,最好把生物重復(fù)和技術(shù)重復(fù)做全了?

然而StatQuest推薦的策略是只需要生物重復(fù)即可闸与,不需要技術(shù)重復(fù)毙替。為什么岸售?

只做生物重復(fù)

以小鼠的RNA-seq實(shí)驗(yàn)為例,先看一下生物偏差(biological variation)和技術(shù)偏差(technical variation )厂画。

下圖代表小鼠的RNA-seq數(shù)據(jù)凸丸,虛線μ是總體小鼠的Read Counts,藍(lán)色條代表5個(gè)樣本小鼠的Read Counts袱院。那那么樣本小鼠的Read和總體μ是存在一定的差異的屎慢,我們將5個(gè)樣本小鼠的Read取平均:

average = [(μ+5)+(μ-1)+(μ+4)+(μ+2)+(μ-5)] / 5 = μ + (5-1+4+2-5)/5

隨著生物重復(fù)的增多,(5-1+4+2-5)/5會(huì)逐漸趨向于0忽洛,這個(gè)平均數(shù)也會(huì)趨近于總體均值μ腻惠。

image.png

剛才只考慮了生物生物偏差,沒(méi)有考慮技術(shù)偏差脐瑰,下圖中添加了技術(shù)偏差妖枚,棕色條為生物偏差,綠色箭頭為技術(shù)偏差苍在,那么此時(shí)依然可以取5個(gè)樣本小鼠的Read平均:

average = μ + (5-1+4+2-5)/5 + (-2+5+2-2-1)/5

隨著生物重復(fù)的增多绝页,生物偏差(5-1+4+2-5)/5 逐漸趨向于0,技術(shù)偏差也會(huì)逐漸趨向于0寂恬,這個(gè)平均數(shù)也會(huì)趨近于總體均值μ续誉。

所以只做生物重復(fù)就可以很好的使用樣本代表總體。

image.png

只做技術(shù)重復(fù)

繼續(xù)進(jìn)行實(shí)驗(yàn)初肉,下圖代表對(duì)1#小鼠測(cè)定了5次RNA-seq數(shù)據(jù)酷鸦。那么同樣方法取5個(gè)RNA-seq數(shù)據(jù)的平均:

average = μ + 5 + (-2+5+2-2-1)/5

隨著技術(shù)重復(fù)數(shù)的增加,技術(shù)偏差(-2+5+2-2-1)/5會(huì)逐漸趨近于0牙咏,而這個(gè)平均數(shù)會(huì)逐漸趨近于μ + 5芭挽,永遠(yuǎn)也不會(huì)等于總體均值μ但指,因此做再多的技術(shù)重復(fù),最終的RNA-seq數(shù)據(jù)也無(wú)法很好的代表總體。


image.png

同時(shí)做生物重復(fù)和技術(shù)重復(fù)

以下圖為例腊状,1#小鼠做了2個(gè)技術(shù)重復(fù)纹烹,2#小鼠做了3個(gè)技術(shù)重復(fù)喻圃,此時(shí)的生物偏差為5屈雄、5、-1伊磺、-1盛正、-1,而技術(shù)偏差不變(技術(shù)偏差是參數(shù)測(cè)定時(shí)的偏差屑埋,不會(huì)因樣本而異豪筝,而且因樣本而已的偏差肯定是樣本偏差),所以樣本均值為:

average = μ + (5+5-1-1-1)/5 + (-2+5+2-2-1)/5

隨著樣本量的增加,技術(shù)偏差(-2+5+2-2-1)/5會(huì)逐漸趨向于零壤蚜。

但生物偏差(5+5-1-1-1)/5雖然也會(huì)收斂到0即寡,但是此時(shí)所需要的樣本量比'只做生物重復(fù)’時(shí)大大增加徊哑,也就是說(shuō)生物偏差的收斂速度變慢了袜刷。

image.png

這個(gè)生物偏差收斂變慢的速度有多慢呢?

假如多了3個(gè)技術(shù)重復(fù)莺丑,那么就需要3倍的樣本量才能抵得上'只做生物重復(fù)’時(shí)的收斂速度著蟹。說(shuō)白了,就是多做的技術(shù)重復(fù)最多不過(guò)和'只做生物重復(fù)’的效果持平而已梢莽。

image.png

做一下總結(jié):

只做生物重復(fù):最佳的實(shí)驗(yàn)設(shè)計(jì)萧豆,可以很好的代表總體;

只做技術(shù)重復(fù)昏名,沒(méi)有生物重復(fù):不要使用這種實(shí)驗(yàn)設(shè)計(jì)涮雷,永遠(yuǎn)只會(huì)得到總體的有偏估計(jì)。

生物重復(fù)和技術(shù)重復(fù):不推薦做轻局,并不能很好的提高樣本的代表性洪鸭,要么獲得一個(gè)有偏的估計(jì),要么需要更多的樣本仑扑。

image.png

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末览爵,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子镇饮,更是在濱河造成了極大的恐慌蜓竹,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件储藐,死亡現(xiàn)場(chǎng)離奇詭異俱济,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)钙勃,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門蛛碌,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人肺缕,你說(shuō)我怎么就攤上這事左医。” “怎么了同木?”我有些...
    開(kāi)封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵浮梢,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我彤路,道長(zhǎng)秕硝,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任洲尊,我火速辦了婚禮远豺,結(jié)果婚禮上奈偏,老公的妹妹穿的比我還像新娘。我一直安慰自己躯护,他們只是感情好惊来,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著棺滞,像睡著了一般裁蚁。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上继准,一...
    開(kāi)封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天枉证,我揣著相機(jī)與錄音,去河邊找鬼移必。 笑死室谚,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的崔泵。 我是一名探鬼主播秒赤,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼管削!你這毒婦竟也來(lái)了倒脓?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤含思,失蹤者是張志新(化名)和其女友劉穎崎弃,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體含潘,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡饲做,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了遏弱。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片盆均。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖漱逸,靈堂內(nèi)的尸體忽然破棺而出泪姨,到底是詐尸還是另有隱情,我是刑警寧澤饰抒,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布肮砾,位于F島的核電站,受9級(jí)特大地震影響袋坑,放射性物質(zhì)發(fā)生泄漏仗处。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望婆誓。 院中可真熱鬧吃环,春花似錦、人聲如沸洋幻。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)鞋屈。三九已至范咨,卻和暖如春故觅,著一層夾襖步出監(jiān)牢的瞬間厂庇,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工输吏, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留权旷,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓贯溅,卻偏偏與公主長(zhǎng)得像拄氯,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子它浅,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容