許多重要的農(nóng)藝性狀為數(shù)量性狀,由多個(gè)基因位點(diǎn)控制导匣。利用傳統(tǒng)的分子標(biāo)記技術(shù)進(jìn)行基因定位干旧,常常需要花費(fèi)較長(zhǎng)的時(shí)間和大量的人力物力斥杜。2012年日本巖手大學(xué)(Iwate university)的科學(xué)家Ryohei Terauchi 和他的團(tuán)隊(duì)在Nature biotechnology上發(fā)表了Mutmap方法速妖,該方法利用混池重測(cè)序可以快速實(shí)現(xiàn)基因定位高蜂,大大提高了遺傳定位的效率。
并在Iwate biotechnology research center上發(fā)布了mutmap的pipeline和protocol罕容。
網(wǎng)站地址:http://genome-e.ibrc.or.jp/home/bioinformatics-team/mutmap
1 利用Mutmap進(jìn)行基因定位的原理
1)對(duì)已有參考基因組的野生型材料進(jìn)行誘變备恤,產(chǎn)生突變體材料,例如使用EMS進(jìn)行誘變處理锦秒。
2)利用突變后代進(jìn)行自交露泊,直到得到純合穩(wěn)定的突變后代。對(duì)攜帶重要農(nóng)藝性狀或感興趣的性狀的純合突變體進(jìn)行研究旅择。
3)將選出來的突變體與野生型進(jìn)行雜交惭笑,產(chǎn)生的F1進(jìn)行自交產(chǎn)生F2(>100),對(duì)F2植株進(jìn)行表型鑒定生真。
4)在F2群體中脖咐,大部分的位點(diǎn)的野生型/突變體SNP、Indels的分離比為1:1汇歹,但是在純合突變表型的F2個(gè)體中與控制表型的位點(diǎn)連鎖越緊密的SNP出現(xiàn)突變體型的SNP的概率越高,突變體型的SNP概率范圍為50%~100%偿凭。
5)將F2群體中表現(xiàn)為突變體表型的植株進(jìn)行混池測(cè)序(Sequence the bulked DNA)产弹。
6)利用SNP index=含有突變體型SNP的reads數(shù)目/所有比對(duì)到該位點(diǎn)的reads數(shù),SNP index值越趨近于1,該SNP與目的基因位點(diǎn)連鎖越緊密痰哨,SNP index 值越趨近于0.5胶果,該SNP與目的基因位點(diǎn)距離越遠(yuǎn)。
7)測(cè)序深度斤斧、突變體混池群體大小早抠、表型分裂和鑒定都會(huì)影響最終SNP index的結(jié)果。作者在supplementary data中利用統(tǒng)計(jì)學(xué)方法對(duì)這些因素進(jìn)行分析撬讽,幫助判斷哪些SNP index值較高的SNP為假陽性位點(diǎn)蕊连。
7.1)混池測(cè)序植株數(shù)目和測(cè)序深度的影響(Fig S 1)
假設(shè)n為進(jìn)行bulk sequencing 的植株數(shù),G為測(cè)序深度游昼。通過統(tǒng)計(jì)學(xué)分析可以得出甘苍,測(cè)序深度G一定時(shí),增加n可以顯著將降低SNP index的變異程度烘豌,當(dāng)n一定時(shí)增加G载庭,雖然也可降低SNP index的變異程度,但降低的水平較小廊佩。
因此可以通過增加混池測(cè)序植株數(shù)目n或提高測(cè)序深度囚聚,來降低假陽性出現(xiàn)的概率。
7.2)表型鑒定誤差的影響(Fig S 2)
在混池測(cè)序時(shí)标锄,應(yīng)準(zhǔn)確選取突變表型的植株顽铸。如果將表型為野生型的個(gè)體混入,就會(huì)降低casual SNP 的 index值鸯绿,從而造成假陰性的錯(cuò)誤跋破。為此作者假設(shè)錯(cuò)誤表型個(gè)體混入的植株數(shù)目為j,混池測(cè)序植株數(shù)目為n瓶蝴,測(cè)序深度為G毒返。從圖A可知,G和n固定舷手,隨著j的增大拧簸,SNP index逐漸向左移,且方差變大男窟。由圖B可知盆赤,n和j固定增加測(cè)序深度,可以顯著降低方差歉眷,且high SNP index數(shù)量增加牺六。由圖C可知,j/n固定汗捡,隨著n的增加淑际,SNP index的分布變化不大。
由此,當(dāng)池中混入野生型個(gè)體時(shí)春缕,應(yīng)提高測(cè)序深度G來降低假陰性的概率盗胀。
此外,作者還指出锄贼,使用全基因組較少的SNP數(shù)目票灰,可以提高準(zhǔn)確性,因此應(yīng)選取高質(zhì)量的SNP位點(diǎn)進(jìn)行后續(xù)分析宅荤。casual SNP附近出現(xiàn)的high SNP index的SNP cluster屑迂,可以幫助判斷casual SNP的真實(shí)性。
2 利用Mutmap方法對(duì)水稻淺綠色葉片突變體進(jìn)行遺傳分析
作者利用Mutmap方法對(duì)
3 分析流程
所有分析操作均在Mutmap protocol中膘侮,此處僅寫出主要步驟及注意事項(xiàng)屈糊。
1)Protocol、pipeline及數(shù)據(jù)下載
1.1)protocol和pipeline:http://genome-e.ibrc.or.jp/home/bioinformatics-team/mutmapa
1.2)日本晴參考基因組:
https://rapdb.dna.affrc.go.jp/download/archive/irgsp1/IRGSP-1.0_genome.fasta.gz
http://rice.plantbiology.msu.edu/pub/data/Eukaryotic_Projects/o_sativa/annotation_dbs/pseudomolecules/version_7.0/all.dir/all.chrs.con
1.3)野生型測(cè)序數(shù)據(jù)和突變體混池測(cè)序數(shù)據(jù):
建議使用lftp進(jìn)行下載
如:lftp ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA000/DRA000499 -e "mirror -c --parallel=3;exit"
2)數(shù)據(jù)壓縮及重命名
重命名的規(guī)則*_[0~9]_[1,2]_sequence.txt.gz
其中*為樣品的名稱或自己想要的標(biāo)記(可將后續(xù)操作中anyname琼了、mybulk目錄修改為*)逻锐,[0~9]為測(cè)序時(shí)flow cell的編號(hào),[1雕薪,2]此處只能填寫1或2昧诱,為雙端測(cè)序的read1和read2。
3)參數(shù)設(shè)置
3.1)建立原始文件鏈接
在/myhome/MutMap_test/1.qualify_read/anyname和cd /myhome/MutMap_test/1.qualify_read/mybulk目錄下所袁,利用ln -s分別建立原始測(cè)序數(shù)據(jù)鏈接 盏档。
3.2)添加參考基因組fasta文件
cp public.fasta /myhome/MutMap_test/downloaded_fasta/
3.3)編輯config.txt修改pipeline參數(shù)
按照protocol中的要求修改~/MutMap_test/config.txt中的參數(shù)。
3.4)運(yùn)行Bat_make_common.fnc.sh文件
./myhome/MutMap_test/Bat_make_common.fnc.sh
運(yùn)行后燥爷,會(huì)在/disk5/mwang/mutmap/MutMap_test/1.qualify_read/anyname(和mybulk)/q30p90/下產(chǎn)生sep_pair目錄蜈亩,對(duì)于后續(xù)運(yùn)行重要。
4)通過SNP替換產(chǎn)生野生型的參考基因組
第一步前翎,利用BWA將過濾后的野生型雙端測(cè)序數(shù)據(jù)比對(duì)到日本晴基因組上稚配。
第二步,用比對(duì)產(chǎn)生的SNP對(duì)日本晴參考基因組進(jìn)行替換港华,產(chǎn)生野生型的參考基因組道川。
第三步,將被過濾的reads