【轉(zhuǎn)載】生物學(xué)重復(fù)與技術(shù)重復(fù)

生物重復(fù)和技術(shù)重復(fù)分別是什么闹获?在一個(gè)實(shí)驗(yàn)中應(yīng)該如何安排生物重復(fù)和技術(shù)重復(fù)敛瓷?
重復(fù)是實(shí)驗(yàn)設(shè)計(jì)的重要原則之一,實(shí)驗(yàn)重復(fù)無(wú)論對(duì)于實(shí)驗(yàn)結(jié)果的可重復(fù)性年堆,還是對(duì)于最終實(shí)驗(yàn)結(jié)論的可靠性吞杭,都起著起決定性的作用。
實(shí)驗(yàn)重復(fù)還可以進(jìn)一步細(xì)分為生物重復(fù)(biological replicates)和技術(shù)重復(fù)(technical replicates)嘀韧,那么生物重復(fù)和技術(shù)重復(fù)分別是什么篇亭?在一個(gè)實(shí)驗(yàn)中應(yīng)該如何安排生物重復(fù)和技術(shù)重復(fù)缠捌?
生物重復(fù)和技術(shù)重復(fù)分別是什么锄贷?
生物重復(fù):指對(duì)同一個(gè)處理組中獨(dú)立來(lái)源的重復(fù)樣本分別進(jìn)行獨(dú)立分析,是整個(gè)實(shí)驗(yàn)的完全重復(fù)曼月,如將具有同一基因型的多個(gè)細(xì)胞株進(jìn)行獨(dú)立地測(cè)定谊却。由于遺傳和環(huán)境等因素的影響會(huì)引起有機(jī)體的個(gè)體差異,因此需要采用生物重復(fù)的實(shí)驗(yàn)設(shè)計(jì)方法來(lái)消除該差異哑芹。目前都以3次生物學(xué)重復(fù)實(shí)驗(yàn)設(shè)計(jì)為主炎辨,要求嚴(yán)格的實(shí)驗(yàn)可以做5次重復(fù)。
技術(shù)重復(fù):指對(duì)同一樣本進(jìn)行重復(fù)地檢測(cè)分析聪姿,例如同一份細(xì)胞中抽提的蛋白質(zhì)進(jìn)行三次質(zhì)譜檢測(cè)碴萧,或者對(duì)同一RNA-seq樣本測(cè)序3次。與生物學(xué)重復(fù)相比末购,技術(shù)重復(fù)的測(cè)量變異程度較小破喻,從而可以減少實(shí)驗(yàn)中的分析變異,將對(duì)同一份樣本產(chǎn)生高重復(fù)性的測(cè)量結(jié)果 盟榴。
簡(jiǎn)單來(lái)講曹质,生物重復(fù)是生物級(jí)別的重復(fù),一般都是生物樣本的重復(fù)擎场。而技術(shù)重復(fù)羽德,更多的是參數(shù)測(cè)定環(huán)節(jié)的重復(fù),一般是對(duì)同一生物樣本進(jìn)行多次測(cè)定迅办。
進(jìn)一步分析宅静,其實(shí)可以發(fā)現(xiàn)生物重復(fù)是衡量實(shí)驗(yàn)的總波動(dòng)的(處理組間的差異不列入此處的波動(dòng),他們應(yīng)該稱為效應(yīng))站欺,它包括樣本個(gè)體間差異和技術(shù)重復(fù)差異姨夹,而技術(shù)重復(fù)更多的是單純的衡量參數(shù)測(cè)量時(shí)的波動(dòng),如實(shí)驗(yàn)操作嫻熟程度镊绪、儀器穩(wěn)定性等等匀伏。
在一個(gè)實(shí)驗(yàn)中應(yīng)該如何安排生物重復(fù)和技術(shù)重復(fù)?
如此說(shuō)來(lái)蝴韭,對(duì)于一個(gè)實(shí)驗(yàn)來(lái)說(shuō)够颠,如果條件允許的話,最好把生物重復(fù)和技術(shù)重復(fù)做全了榄鉴?
然而StatQuest推薦的策略是只需要生物重復(fù)即可履磨,不需要技術(shù)重復(fù)蛉抓。為什么?
只做生物重復(fù)
以小鼠的RNA-seq實(shí)驗(yàn)為例剃诅,先看一下生物偏差(biological variation)和技術(shù)偏差(technical variation )巷送。
下圖代表小鼠的RNA-seq數(shù)據(jù),虛線μ是總體小鼠的Read Counts矛辕,藍(lán)色條代表5個(gè)樣本小鼠的Read Counts笑跛。那那么樣本小鼠的Read和總體μ是存在一定的差異的,我們將5個(gè)樣本小鼠的Read取平均:
average = [(μ+5)+(μ-1)+(μ+4)+(μ+2)+(μ-5)] / 5 = μ + (5-1+4+2-5)/5
隨著生物重復(fù)的增多聊品,(5-1+4+2-5)/5會(huì)逐漸趨向于0飞蹂,這個(gè)平均數(shù)也會(huì)趨近于總體均值μ。

剛才只考慮了生物生物偏差翻屈,沒有考慮技術(shù)偏差陈哑,下圖中添加了技術(shù)偏差,棕色條為生物偏差伸眶,綠色箭頭為技術(shù)偏差惊窖,那么此時(shí)依然可以取5個(gè)樣本小鼠的Read平均:
average = μ + (5-1+4+2-5)/5 + (-2+5+2-2-1)/5
隨著生物重復(fù)的增多,生物偏差(5-1+4+2-5)/5 逐漸趨向于0厘贼,技術(shù)偏差也會(huì)逐漸趨向于0界酒,這個(gè)平均數(shù)也會(huì)趨近于總體均值μ。
所以只做生物重復(fù)就可以很好的使用樣本代表總體涂臣。

只做技術(shù)重復(fù)
繼續(xù)進(jìn)行實(shí)驗(yàn)盾计,下圖代表對(duì)1#小鼠測(cè)定了5次RNA-seq數(shù)據(jù)。那么同樣方法取5個(gè)RNA-seq數(shù)據(jù)的平均:
average = μ + 5 + (-2+5+2-2-1)/5
隨著技術(shù)重復(fù)數(shù)的增加赁遗,技術(shù)偏差(-2+5+2-2-1)/5會(huì)逐漸趨近于0署辉,而這個(gè)平均數(shù)會(huì)逐漸趨近于μ + 5,永遠(yuǎn)也不會(huì)等于總體均值μ岩四,因此做再多的技術(shù)重復(fù)哭尝,最終的RNA-seq數(shù)據(jù)也無(wú)法很好的代表總體。

同時(shí)做生物重復(fù)和技術(shù)重復(fù)
以下圖為例剖煌,1#小鼠做了2個(gè)技術(shù)重復(fù)材鹦,2#小鼠做了3個(gè)技術(shù)重復(fù),此時(shí)的生物偏差為5耕姊、5桶唐、-1、-1茉兰、-1尤泽,而技術(shù)偏差不變(技術(shù)偏差是參數(shù)測(cè)定時(shí)的偏差,不會(huì)因樣本而異,而且因樣本而已的偏差肯定是樣本偏差)坯约,所以樣本均值為:
average = μ + (5+5-1-1-1)/5 + (-2+5+2-2-1)/5
隨著樣本量的增加熊咽,技術(shù)偏差(-2+5+2-2-1)/5會(huì)逐漸趨向于零。
但生物偏差(5+5-1-1-1)/5雖然也會(huì)收斂到0闹丐,但是此時(shí)所需要的樣本量比‘只做生物重復(fù)’時(shí)大大增加横殴,也就是說(shuō)生物偏差的收斂速度變慢了。

這個(gè)生物偏差收斂變慢的速度有多慢呢卿拴?
假如多了3個(gè)技術(shù)重復(fù)衫仑,那么就需要3倍的樣本量才能抵得上‘只做生物重復(fù)’時(shí)的收斂速度。說(shuō)白了巍棱,就是多做的技術(shù)重復(fù)最多不過(guò)和‘只做生物重復(fù)’的效果持平而已惑畴。

做一下總結(jié):
只做生物重復(fù):最佳的實(shí)驗(yàn)設(shè)計(jì)蛋欣,可以很好的代表總體航徙;
只做技術(shù)重復(fù),沒有生物重復(fù):不要使用這種實(shí)驗(yàn)設(shè)計(jì)陷虎,永遠(yuǎn)只會(huì)得到總體的有偏估計(jì)到踏。
生物重復(fù)和技術(shù)重復(fù):不推薦做,并不能很好的提高樣本的代表性尚猿,要么獲得一個(gè)有偏的估計(jì)窝稿,要么需要更多的樣本。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末凿掂,一起剝皮案震驚了整個(gè)濱河市伴榔,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌庄萎,老刑警劉巖踪少,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異糠涛,居然都是意外死亡援奢,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門忍捡,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)集漾,“玉大人,你說(shuō)我怎么就攤上這事砸脊【咂” “怎么了?”我有些...
    開封第一講書人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵凌埂,是天一觀的道長(zhǎng)驱显。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么秒紧? 我笑而不...
    開封第一講書人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任绢陌,我火速辦了婚禮,結(jié)果婚禮上熔恢,老公的妹妹穿的比我還像新娘脐湾。我一直安慰自己,他們只是感情好叙淌,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開白布秤掌。 她就那樣靜靜地躺著,像睡著了一般鹰霍。 火紅的嫁衣襯著肌膚如雪闻鉴。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,954評(píng)論 1 283
  • 那天茂洒,我揣著相機(jī)與錄音孟岛,去河邊找鬼。 笑死督勺,一個(gè)胖子當(dāng)著我的面吹牛渠羞,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播智哀,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼次询,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了瓷叫?” 一聲冷哼從身側(cè)響起屯吊,我...
    開封第一講書人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎摹菠,沒想到半個(gè)月后盒卸,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡辨嗽,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年世落,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片糟需。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡屉佳,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出洲押,到底是詐尸還是另有隱情武花,我是刑警寧澤,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布杈帐,位于F島的核電站体箕,受9級(jí)特大地震影響专钉,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜累铅,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一跃须、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧娃兽,春花似錦菇民、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至玛荞,卻和暖如春娇掏,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背勋眯。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工婴梧, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人凡恍。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓志秃,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親嚼酝。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容