必看赃阀!測(cè)序?qū)嶒?yàn)不翻車的必備經(jīng)驗(yàn)!

盡管測(cè)序技術(shù)在不斷發(fā)展,但不論是哪種測(cè)序平臺(tái)酌予,測(cè)序過(guò)程中都不可避免地存在一些錯(cuò)誤永票。在2014年,《Nature Review Genetics》發(fā)表了一篇很有意思的綜述驮俗,談?wù)摿?strong>二代測(cè)序?qū)嶒?yàn)中的三類錯(cuò)誤來(lái)源懂缕,以及如何利用重復(fù)來(lái)減少這些錯(cuò)誤。文章的作者之一就是著名的遺傳學(xué)家George Church王凑。


在實(shí)驗(yàn)過(guò)程中使用重復(fù)是經(jīng)過(guò)時(shí)間檢驗(yàn)的法則搪柑,然而,由于成本較高索烹,以及深度測(cè)序已提供一種類型的重復(fù)這一事實(shí)工碾,很多實(shí)驗(yàn)室忽略了重復(fù)的重要性。但“讀取深度”的范圍有限百姓,而其他類型的重復(fù)渊额,如技術(shù)重復(fù)、生物學(xué)重復(fù)及跨平臺(tái)的重復(fù)也非常有用瓣戚。


2011年7月發(fā)表在《Nature Biotechnology》上的一篇文章就曾為研究人員以及雜志審稿人敲響了警鐘端圈。文章指出,測(cè)序技術(shù)并不能消除生物學(xué)差異子库。和芯片技術(shù)一樣舱权,新一代測(cè)序技術(shù)也需要生物學(xué)重復(fù)

在測(cè)序過(guò)程中仑嗅,由于我們能夠?qū)悠愤M(jìn)行多重分析宴倍,故良好的實(shí)驗(yàn)設(shè)計(jì)能夠利用技術(shù)重復(fù),對(duì)同一個(gè)樣品進(jìn)行多次測(cè)序仓技。目前一些研究使用技術(shù)重復(fù)鸵贬,將數(shù)據(jù)集中起來(lái)用于進(jìn)一步分析。

也有一些研究綜合多個(gè)測(cè)序技術(shù)脖捻,來(lái)改善變異檢出阔逼。例如,Illumina的短讀長(zhǎng)搭配PacBio的長(zhǎng)讀長(zhǎng)地沮,這就是個(gè)跨平臺(tái)重復(fù)的很好例子嗜浮。2013年11月羡亩,《PNAS》在線版上發(fā)表了一篇文章,就是將Illumina與PacBio的測(cè)序技術(shù)結(jié)合起來(lái)危融,來(lái)解決異構(gòu)體鑒定和定量的問(wèn)題畏铆。


生物學(xué)重復(fù)是指對(duì)同一條件下同一宿主的多個(gè)生物學(xué)樣品進(jìn)行測(cè)序,這也是差異表達(dá)分析的必需吉殃。這篇綜述就詳細(xì)介紹了利用不同組織的生物學(xué)重復(fù)來(lái)校正變異檢出中的錯(cuò)誤辞居。


它深入研究了三個(gè)來(lái)自Complete Genomics的全基因組序列數(shù)據(jù)。作者將SNP歸為一致或不一致蛋勺,這取決于所有重復(fù)是否一致瓦灶。利用多個(gè)打分方案,如讀取深度迫卢、基因表達(dá)得分和基因組質(zhì)量得分倚搬,作者利用ROC樣的曲線分析了真陽(yáng)性和真陰性的比例。有趣的是乾蛤,相對(duì)于基因組質(zhì)量得分和表達(dá)得分每界,以讀取深度作為質(zhì)量得分卻表現(xiàn)不佳。

當(dāng)然家卖,光靠重復(fù)也不能解決所有的測(cè)序錯(cuò)誤眨层。對(duì)于參考基因組不完整、插入上荡、缺失或重復(fù)的錯(cuò)誤趴樱,我們還要另想辦法解決。

此外酪捡,這篇文章還歸類了錯(cuò)誤的實(shí)驗(yàn)來(lái)源以及最早發(fā)現(xiàn)錯(cuò)誤的文章叁征。正如大家想象的一樣,測(cè)序過(guò)程中的每一步都有可能混入錯(cuò)誤逛薇,從樣品制備到數(shù)據(jù)分析捺疼,因此大家一定要小心。

測(cè)序錯(cuò)誤主要有三大類永罚,分別來(lái)自樣品制備啤呼、文庫(kù)制備,以及測(cè)序和成像呢袱。



來(lái)源于樣品制備的測(cè)序錯(cuò)誤


1. 用戶錯(cuò)誤官扣;例如,貼錯(cuò)標(biāo)簽羞福。雖然這是個(gè)低級(jí)錯(cuò)誤惕蹄,但肯定不會(huì)沒(méi)犯過(guò)。在芯片分析中,貼錯(cuò)標(biāo)簽和樣品搞混可都是真事焊唬,有文獻(xiàn)可查恋昼。

2. DNA或RNA的降解;例如赶促,組織自溶,福爾馬林固定石蠟包埋(FFPE)組織制備過(guò)程中的核酸降解和交聯(lián)挟炬。

3. 異源序列的污染鸥滨;例如,那些支原體和異種移植的宿主谤祖。

4. DNA起始量低婿滓。早在2005年人們就發(fā)現(xiàn),在PCR過(guò)程中粥喜,DNA起始量低的模板會(huì)以序列依賴的方式產(chǎn)生虛假的突變凸主,主要是從G轉(zhuǎn)變?yōu)锳。



來(lái)源于文庫(kù)制備的測(cè)序錯(cuò)誤


1. 用戶錯(cuò)誤额湘;例如卿吐,一個(gè)樣品的DNA殘留到下一個(gè),之前反應(yīng)的污染锋华。

2. PCR擴(kuò)增錯(cuò)誤嗡官。這個(gè)同上面第4點(diǎn)。

3. 引物偏向毯焕;例如衍腥,結(jié)合偏向,甲基化偏向纳猫,錯(cuò)配導(dǎo)致的偏向婆咸,非特異性結(jié)合和引物二聚體的形成,發(fā)夾結(jié)構(gòu)和干擾環(huán)芜辕,熔解溫度太高或太低引入的偏向尚骄。

4. 3’短捕獲偏向,在高通量RNA測(cè)序的poly(A)富集過(guò)程中引入物遇。

5. 獨(dú)家突變乖仇;例如,那些由重復(fù)區(qū)域或獨(dú)家變異的錯(cuò)配而引入的突變询兴。

6. 機(jī)器故障乃沙;例如,PCR循環(huán)溫度不正確诗舰。

7. 嵌合讀取警儒。

8. 條形碼和/或接頭錯(cuò)誤;例如,接頭污染蜀铲,缺乏條形碼多樣性和不兼容的條形碼边琉。



來(lái)源于測(cè)序和成像的測(cè)序錯(cuò)誤


1. 用戶錯(cuò)誤;例如记劝,流動(dòng)槽過(guò)載引起的簇crosstalk变姨。

2. 移相;例如厌丑,不完整的延伸以及多個(gè)核苷酸而不是單個(gè)核苷酸的添加定欧。

3. “Dead”熒光基團(tuán),受損的核苷酸以及重疊信號(hào)怒竿。

4. 序列背景砍鸠;例如,富含GC耕驰,同源和低復(fù)雜度的區(qū)域爷辱,及均聚物。

5. 機(jī)器故障朦肘;例如饭弓,激光器、硬盤厚骗、軟件和流體系統(tǒng)出故障示启。

6. 鏈的偏向

由此可見(jiàn)领舰,測(cè)序錯(cuò)誤可能來(lái)源于實(shí)驗(yàn)的每一步夫嗓。除了設(shè)計(jì)各種重復(fù),大家在操作過(guò)程中也定要留心冲秽,避免讓錯(cuò)誤有空子可鉆舍咖。


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市锉桑,隨后出現(xiàn)的幾起案子排霉,更是在濱河造成了極大的恐慌,老刑警劉巖民轴,帶你破解...
    沈念sama閱讀 211,042評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件攻柠,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡后裸,警方通過(guò)查閱死者的電腦和手機(jī)瑰钮,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評(píng)論 2 384
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)微驶,“玉大人浪谴,你說(shuō)我怎么就攤上這事开睡。” “怎么了苟耻?”我有些...
    開封第一講書人閱讀 156,674評(píng)論 0 345
  • 文/不壞的土叔 我叫張陵篇恒,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我凶杖,道長(zhǎng)胁艰,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,340評(píng)論 1 283
  • 正文 為了忘掉前任智蝠,我火速辦了婚禮蝗茁,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘寻咒。我一直安慰自己,他們只是感情好颈嚼,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,404評(píng)論 5 384
  • 文/花漫 我一把揭開白布毛秘。 她就那樣靜靜地躺著,像睡著了一般阻课。 火紅的嫁衣襯著肌膚如雪叫挟。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,749評(píng)論 1 289
  • 那天限煞,我揣著相機(jī)與錄音抹恳,去河邊找鬼。 笑死署驻,一個(gè)胖子當(dāng)著我的面吹牛奋献,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播旺上,決...
    沈念sama閱讀 38,902評(píng)論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼瓶蚂,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了宣吱?” 一聲冷哼從身側(cè)響起窃这,我...
    開封第一講書人閱讀 37,662評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎征候,沒(méi)想到半個(gè)月后杭攻,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,110評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡疤坝,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,451評(píng)論 2 325
  • 正文 我和宋清朗相戀三年兆解,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片卒煞。...
    茶點(diǎn)故事閱讀 38,577評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡痪宰,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情衣撬,我是刑警寧澤乖订,帶...
    沈念sama閱讀 34,258評(píng)論 4 328
  • 正文 年R本政府宣布,位于F島的核電站具练,受9級(jí)特大地震影響乍构,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜扛点,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,848評(píng)論 3 312
  • 文/蒙蒙 一哥遮、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧陵究,春花似錦眠饮、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至松蒜,卻和暖如春扔茅,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背秸苗。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評(píng)論 1 264
  • 我被黑心中介騙來(lái)泰國(guó)打工召娜, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人惊楼。 一個(gè)月前我還...
    沈念sama閱讀 46,271評(píng)論 2 360
  • 正文 我出身青樓玖瘸,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親胁后。 傳聞我的和親對(duì)象是個(gè)殘疾皇子店读,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,452評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容