illumina的barcode居然有那么多類型

前段時(shí)間第一次拿到200多個(gè)群體的測序數(shù)據(jù)，準(zhǔn)備對這些數(shù)據(jù)分析，然后就遇到自己以前分析幾個(gè)樣本不會遇到的問題：illumina平臺一次上機(jī)會得到好幾個(gè)T的數(shù)據(jù)童社，公司是如何保證不會把數(shù)據(jù)給錯(cuò)用戶呢蛛倦？

其實(shí)答案我也知道耻煤，就是給不同樣本加上barcode，但是我沒想到的是barcode居然有那么多組合方式茶袒。

barcode雖然可以簡單分為兩種梯刚，如下

inline barcode: 出現(xiàn)在一條read的堿基序列中
index barcode: 出現(xiàn)在一條read的ID部分

但是在reads中出現(xiàn)的花樣就特別多了，可以只在一端read中出現(xiàn)Inline barcode（圖一）薪寓，或在一端read中出現(xiàn)index barcode（圖二）亡资，也可以在一端read中同時(shí)有inline barcode和index barcode（圖三）澜共，也可以在一端有inline barcode 加 index barcode，在另一端只有 index barcode（圖四）锥腻，以及在兩端都只有index barcode（圖五）, 最后是在兩端都有 inline barcode（圖六）

圖一：SE|PE single inline barcode

圖二：SE|PE single index barcode

圖三：SE inline barcode + index barcode

圖四：PE inline barcode + index barcode

圖五：PE index barcode

圖六：PE inline barcode

雖然有那么多加barcode的策略嗦董，但其實(shí)本質(zhì)上是兩種標(biāo)記策略。當(dāng)然還有一種策略就是你承包一條lane瘦黑，這樣子你就不需要加barcode京革，也就是圖A。

圖B中的Barcode就是inline code幸斥，它在接頭的5'端即測序引物那部分上匹摇，和DNA片段鄰近，在測序的時(shí)候甲葬，加入引物廊勃，然后一邊合成一邊測序，于是在最后的序列中就會引入barcode经窖。

圖C的Index是index barcode坡垫，在接頭的3'端，測序的時(shí)候也是先加第一個(gè)引物(SP1)钠至，然后一邊合成一邊測序葛虐，等讀完之后，再加入index引物(IP)去測index的部分棉钧，對樣本進(jìn)行區(qū)分屿脐，因此不會占用讀長。

barcode

Rd: read宪卿，短讀
SP: sequencing primers的诵，測序引物

如果樣本比較小，也就是十幾個(gè)佑钾，公司會用index barcode西疤，得到的read長度都是100或150。如果樣本有上百個(gè)休溶，公司就考慮用inline barcode代赁，如果返回的是分開樣本的fastq，那么長度就不到150兽掰，100芭碍，因?yàn)槿サ袅薸nline barcode。

最后強(qiáng)烈推薦觀看這個(gè)視頻陳巍學(xué)基因1：Illumina測序化學(xué)原理

最后編輯于：2018.03.29 10:19:39

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者