在GetOrganelle組裝結(jié)果中爱谁,如果直接成環(huán)且無多余的正向晒喷、反向重復(fù)序列,那么就能看到圖1所示的結(jié)果访敌。
graph1.1與1.2就是ssc的兩種構(gòu)象凉敲。但若基因組存在IR區(qū)之外的重復(fù)序列,這里的graph就會(huì)增多寺旺,例如圖2爷抓,在IR區(qū)中存在一個(gè)正向重復(fù),導(dǎo)致出現(xiàn)6種可選構(gòu)象(圖3)
每個(gè)gragh1.x的長(zhǎng)度均為160570 bp蓝撇,但將圖2進(jìn)行理論性重構(gòu)應(yīng)該是90315+7062+1204+1102+251302+19143=161830 bp。
于是我在Bandage中對(duì)圖2進(jìn)行拆解陈莽。正向重復(fù)的部分拆解很容易渤昌,但為了得到如圖1那樣針對(duì)ssc的兩種構(gòu)象,我反復(fù)嘗試走搁,按照?qǐng)D4的方法独柑,卻總是難以獲得想要的那兩種構(gòu)象,有時(shí)雖然獲得了(圖5-B)私植,但確是出于巧合忌栅。我很疑惑,在我出乎意料地獲得第三種構(gòu)象(圖5-C)后曲稼,我開始領(lǐng)悟索绪。Bandage的remove or merge對(duì)數(shù)據(jù)的調(diào)整是絕對(duì)的,任意一種可能的模式調(diào)整都會(huì)導(dǎo)致數(shù)據(jù)采取不同的拼接方式躯肌。連線方式看起來只有圖4兩種模式者春,但結(jié)果應(yīng)該有四種:即LSC and SSC各有正反兩種構(gòu)象,故共可拼出四種數(shù)據(jù)清女。如何才能由兩種連線方式拼出四種構(gòu)象呢钱烟?實(shí)際上當(dāng)對(duì)IR deplicate時(shí),復(fù)制品的移動(dòng)可以向上或向下(圖6)嫡丙,經(jīng)試驗(yàn)拴袭,這將導(dǎo)致不同的構(gòu)象。因此曙博,若想得到目標(biāo)構(gòu)象拥刻,需先以一個(gè)方向,一種連線方式進(jìn)行試驗(yàn)父泳。然后以所得構(gòu)象的共線性結(jié)果進(jìn)行分析般哼,決定如何移動(dòng)IR與連線吴汪。
獲得正確構(gòu)象蒸眠,還需先將positive and negative nodes的結(jié)果一并導(dǎo)出(圖7)漾橙,否則可能只有圖5那種整體反向的結(jié)果。保存的fasta再由bandage打開楞卡,可以看到兩條未成環(huán)的線霜运,選擇性刪除后保存,其中之一是正確的目標(biāo)構(gòu)象(圖8)蒋腮。構(gòu)象校對(duì)后的葉綠體基因組全長(zhǎng)160675 bp淘捡,不是理論的161830 bp,發(fā)現(xiàn)是正向重復(fù)deplicate, merge之后就縮短了池摧,也許是軟件重新審查了重復(fù)序列的邊界焦除,導(dǎo)致的吧。