雙端測(cè)序中read1和read2的關(guān)系

??在跟著健明老師學(xué)習(xí)生物信息學(xué)的過(guò)程中胧砰,少走了很多彎路鳍鸵,躲過(guò)了很多坑,在指導(dǎo)下淺嘗過(guò)一些尉间。但是自己常吵ス裕扣原理,又雙叒叕落坑哲嘲,百思不得其解贪薪。
以下是之前遇到的問(wèn)題,今天整理帶大家一起分析分析眠副,若有不嚴(yán)謹(jǐn)或者錯(cuò)誤的地方画切,強(qiáng)烈歡迎指正

問(wèn)題1
??首先,我們討論一個(gè)問(wèn)題囱怕,我們都知道同源染色體上的堿基并不完全相同霍弹,但是為什么參考基因組參考序列是單序列而不是雙序列呢?

我們需要了解“人類(lèi)基因組計(jì)劃”“千人基因組計(jì)劃”以及2017-12-28央視宣布我國(guó)啟動(dòng)“中國(guó)10萬(wàn)人基因組計(jì)劃”

??人類(lèi)細(xì)胞內(nèi)共有22對(duì)常染色體,2對(duì)性染色體,共24條染色體娃弓。人體有23對(duì),46條染色體,但卻測(cè)定24條染色體.說(shuō)明有部分染色體無(wú)需全測(cè),這很自然的就聯(lián)想到“常染色體每對(duì)是互補(bǔ)配對(duì)”的性質(zhì),說(shuō)明,每對(duì)染色體中的兩條,基因相同,只需測(cè)一條就可知另一條的基因典格。如果是這樣的話,需測(cè)22對(duì)常染色體,那么剩下的就自然是兩條性染色體,因?yàn)閄染色體與Y染色體構(gòu)造有所不同(Y染色體比X少一部分),所以兩條都要測(cè)。
??則一共22條常染色體+2條性染色體=24條染色體台丛。

??然后有人想到了同源染色體上等位基因的情況:

??等位基因(allele)又作allelomorph.可能出現(xiàn)在染色體某特定座位上的兩個(gè)或多個(gè)基因中的一個(gè)钝计。若一個(gè)座位上的基因以兩個(gè)以上的狀態(tài)存在,便稱為復(fù)等位基因齐佳。若成對(duì)的等位基因中兩個(gè)成員完全相同私恬,則該個(gè)體對(duì)此性狀來(lái)說(shuō)成為純合子。若兩個(gè)等位基因各不相同炼吴,則該個(gè)體對(duì)該性狀來(lái)說(shuō)是雜合子本鸣。由于等位基因都對(duì)應(yīng)同一性狀,所以只要測(cè)其中一個(gè),其等位基因會(huì)作為特殊基因單獨(dú)測(cè)序,但不作為人類(lèi)基因組計(jì)劃另外測(cè)定。同源染色體具體的序列不一樣硅蹦,但是結(jié)構(gòu)是一樣的荣德,所以沒(méi)必要多測(cè)。也就是說(shuō)人類(lèi)基因組計(jì)劃要搞清楚的是基因片段與性狀的關(guān)系童芹,重點(diǎn)不在堿基序列涮瞻。
??因?yàn)橥慈旧w上的顯隱性基因控制的是同一性狀的不同表現(xiàn)類(lèi)型!就好比紅綠色盲基因和色覺(jué)正臣偻剩基因是位于同源染色體上的同一位置的署咽!基因測(cè)序時(shí),只要知道這個(gè)位置的基因是控制色覺(jué)的就行了生音!這大概就是人類(lèi)基因組計(jì)劃的目的(通俗意思宁否,請(qǐng)自行谷歌客觀了解)


接下來(lái)我們回顧以下測(cè)序過(guò)程:引出其他問(wèn)題


PCR+測(cè)序
測(cè)序得到兩條read

問(wèn)題2
測(cè)序過(guò)程中以上圖很明顯read1和read2為interset區(qū)域兩條互補(bǔ)鏈并且方向相對(duì)的兩部分序列,那測(cè)序過(guò)程中如何實(shí)現(xiàn)將此兩條序列比對(duì)到單鏈的參考基因組呢缀遍?

??為了得到答案慕匠,翻書(shū),谷歌域醇,看原理視屏依然沒(méi)有解決問(wèn)題台谊,于是在熟練Linux和各文件格式之后,我找了真實(shí)fq數(shù)據(jù)中的一對(duì)reads一探究竟譬挚。
步驟1:找出具體信息為CAY9KANXX:5:1101:1113:2067的一對(duì)fq(一對(duì)reads)锅铅,笨辦法列出所有堿基,如下圖:

圖1:fq_reads

??根據(jù)原理殴瘦,我們可以知道上圖中的fq1和fq2是實(shí)際測(cè)序得到的read1和read2狠角。
注意:Excel排版原因?qū)ead1和read2顯示長(zhǎng)短不一,經(jīng)過(guò)計(jì)算實(shí)際均為150個(gè)堿基蚪腋。


步驟2:然后在得到原始sam/bam文件中找到這對(duì)reads丰歌,并列出堿基觀察(:

圖2:sam/bam_reads

??仔細(xì)肉眼比對(duì)圖二和圖一,發(fā)現(xiàn)bam文件中reads2已被轉(zhuǎn)義并且倒序排列屉凯。為什么這么確定是倒序過(guò)來(lái)的呢立帖?細(xì)心的人會(huì)發(fā)現(xiàn)reads的質(zhì)量值是倒過(guò)來(lái)的。到此問(wèn)題2已經(jīng)得到的解釋悠砚。

為了徹底搞清楚晓勇,我們?cè)贗GV中可視化直觀看一下:

我將圖2中的重復(fù)堿基標(biāo)紅,將這兩條序列的bam文件導(dǎo)入IGV中可視化:

圖3:IGV可視化

圖3中,非常直觀看到兩條帶方向箭頭的灰色條帶(read1和read2)的比對(duì)到單序列的參考基因組(下方彩色條帶)绑咱。


??為了更加直觀绰筛,讓自己死心(我也是服了自己那顆躁動(dòng)的心),我把對(duì)應(yīng)參考序列也列出來(lái)了描融,模擬了一下IGV的比對(duì)情況铝噩,如圖:

圖4:比對(duì)

依然要總結(jié)一下:
??雙端測(cè)序下機(jī)數(shù)據(jù)中得到的read1和read2是兩條互補(bǔ)鏈insertsize中方向相對(duì)的兩條序列,再比對(duì)到單鏈的參考基因組之前會(huì)先將其中一條read轉(zhuǎn)義窿克,然后進(jìn)行比對(duì)骏庸,所以比對(duì)得到的SAM和BAM文件中read1和read2有一條是被轉(zhuǎn)了的。
??全劇終年叮。具被。。只损。一姿。。
參考:
??1.生信技能樹(shù)健明大牛線下培訓(xùn)
??2.基因課視屏截圖
??3.陳巍學(xué)基因

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末改执,一起剝皮案震驚了整個(gè)濱河市啸蜜,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌辈挂,老刑警劉巖衬横,帶你破解...
    沈念sama閱讀 211,817評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異终蒂,居然都是意外死亡蜂林,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,329評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門(mén)拇泣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)噪叙,“玉大人,你說(shuō)我怎么就攤上這事霉翔≌隼伲” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 157,354評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵债朵,是天一觀的道長(zhǎng)子眶。 經(jīng)常有香客問(wèn)我,道長(zhǎng)序芦,這世上最難降的妖魔是什么臭杰? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 56,498評(píng)論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮谚中,結(jié)果婚禮上渴杆,老公的妹妹穿的比我還像新娘寥枝。我一直安慰自己,他們只是感情好磁奖,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,600評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布囊拜。 她就那樣靜靜地躺著,像睡著了一般点寥。 火紅的嫁衣襯著肌膚如雪艾疟。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 49,829評(píng)論 1 290
  • 那天敢辩,我揣著相機(jī)與錄音,去河邊找鬼弟疆。 笑死戚长,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的怠苔。 我是一名探鬼主播同廉,決...
    沈念sama閱讀 38,979評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼柑司!你這毒婦竟也來(lái)了迫肖?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 37,722評(píng)論 0 266
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤攒驰,失蹤者是張志新(化名)和其女友劉穎蟆湖,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體玻粪,經(jīng)...
    沈念sama閱讀 44,189評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡隅津,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,519評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了劲室。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片伦仍。...
    茶點(diǎn)故事閱讀 38,654評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖很洋,靈堂內(nèi)的尸體忽然破棺而出充蓝,到底是詐尸還是另有隱情,我是刑警寧澤喉磁,帶...
    沈念sama閱讀 34,329評(píng)論 4 330
  • 正文 年R本政府宣布谓苟,位于F島的核電站,受9級(jí)特大地震影響线定,放射性物質(zhì)發(fā)生泄漏娜谊。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,940評(píng)論 3 313
  • 文/蒙蒙 一斤讥、第九天 我趴在偏房一處隱蔽的房頂上張望纱皆。 院中可真熱鬧湾趾,春花似錦、人聲如沸派草。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,762評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)近迁。三九已至艺普,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間鉴竭,已是汗流浹背歧譬。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,993評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留搏存,地道東北人瑰步。 一個(gè)月前我還...
    沈念sama閱讀 46,382評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像璧眠,于是被迫代替她去往敵國(guó)和親缩焦。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,543評(píng)論 2 349

推薦閱讀更多精彩內(nèi)容