水稻BSA之利用Mutmap快速進(jìn)行基因定位

許多重要的農(nóng)藝性狀為數(shù)量性狀,由多個(gè)基因位點(diǎn)控制导匣。利用傳統(tǒng)的分子標(biāo)記技術(shù)進(jìn)行基因定位干旧,常常需要花費(fèi)較長(zhǎng)的時(shí)間和大量的人力物力斥杜。2012年日本巖手大學(xué)(Iwate university)的科學(xué)家Ryohei Terauchi 和他的團(tuán)隊(duì)在Nature biotechnology上發(fā)表了Mutmap方法速妖,該方法利用混池重測(cè)序可以快速實(shí)現(xiàn)基因定位高蜂,大大提高了遺傳定位的效率。

Ryohei Terauchi 等于2012年發(fā)表于nature biotechnology上的文章

并在Iwate biotechnology research center上發(fā)布了mutmap的pipeline和protocol罕容。

網(wǎng)站地址:http://genome-e.ibrc.or.jp/home/bioinformatics-team/mutmap

Iwate biotechnology research center 網(wǎng)站mutmap主頁

1 利用Mutmap進(jìn)行基因定位的原理

1)對(duì)已有參考基因組的野生型材料進(jìn)行誘變备恤,產(chǎn)生突變體材料,例如使用EMS進(jìn)行誘變處理锦秒。

2)利用突變后代進(jìn)行自交露泊,直到得到純合穩(wěn)定的突變后代。對(duì)攜帶重要農(nóng)藝性狀或感興趣的性狀的純合突變體進(jìn)行研究旅择。

3)將選出來的突變體與野生型進(jìn)行雜交惭笑,產(chǎn)生的F1進(jìn)行自交產(chǎn)生F2(>100),對(duì)F2植株進(jìn)行表型鑒定生真。

4)在F2群體中脖咐,大部分的位點(diǎn)的野生型/突變體SNP、Indels的分離比為1:1汇歹,但是在純合突變表型的F2個(gè)體中與控制表型的位點(diǎn)連鎖越緊密的SNP出現(xiàn)突變體型的SNP的概率越高,突變體型的SNP概率范圍為50%~100%偿凭。

5)將F2群體中表現(xiàn)為突變體表型的植株進(jìn)行混池測(cè)序(Sequence the bulked DNA)产弹。

6)利用SNP index=含有突變體型SNP的reads數(shù)目/所有比對(duì)到該位點(diǎn)的reads數(shù),SNP index值越趨近于1,該SNP與目的基因位點(diǎn)連鎖越緊密痰哨,SNP index 值越趨近于0.5胶果,該SNP與目的基因位點(diǎn)距離越遠(yuǎn)。

7)測(cè)序深度斤斧、突變體混池群體大小早抠、表型分裂和鑒定都會(huì)影響最終SNP index的結(jié)果。作者在supplementary data中利用統(tǒng)計(jì)學(xué)方法對(duì)這些因素進(jìn)行分析撬讽,幫助判斷哪些SNP index值較高的SNP為假陽性位點(diǎn)蕊连。

7.1)混池測(cè)序植株數(shù)目和測(cè)序深度的影響(Fig S 1)

假設(shè)n為進(jìn)行bulk sequencing 的植株數(shù),G為測(cè)序深度游昼。通過統(tǒng)計(jì)學(xué)分析可以得出甘苍,測(cè)序深度G一定時(shí),增加n可以顯著將降低SNP index的變異程度烘豌,當(dāng)n一定時(shí)增加G载庭,雖然也可降低SNP index的變異程度,但降低的水平較小廊佩。

Figure S1

因此可以通過增加混池測(cè)序植株數(shù)目n或提高測(cè)序深度囚聚,來降低假陽性出現(xiàn)的概率。

7.2)表型鑒定誤差的影響(Fig S 2)

在混池測(cè)序時(shí)标锄,應(yīng)準(zhǔn)確選取突變表型的植株顽铸。如果將表型為野生型的個(gè)體混入,就會(huì)降低casual SNP 的 index值鸯绿,從而造成假陰性的錯(cuò)誤跋破。為此作者假設(shè)錯(cuò)誤表型個(gè)體混入的植株數(shù)目為j,混池測(cè)序植株數(shù)目為n瓶蝴,測(cè)序深度為G毒返。從圖A可知,G和n固定舷手,隨著j的增大拧簸,SNP index逐漸向左移,且方差變大男窟。由圖B可知盆赤,n和j固定增加測(cè)序深度,可以顯著降低方差歉眷,且high SNP index數(shù)量增加牺六。由圖C可知,j/n固定汗捡,隨著n的增加淑际,SNP index的分布變化不大。

由此,當(dāng)池中混入野生型個(gè)體時(shí)春缕,應(yīng)提高測(cè)序深度G來降低假陰性的概率盗胀。

此外,作者還指出锄贼,使用全基因組較少的SNP數(shù)目票灰,可以提高準(zhǔn)確性,因此應(yīng)選取高質(zhì)量的SNP位點(diǎn)進(jìn)行后續(xù)分析宅荤。casual SNP附近出現(xiàn)的high SNP index的SNP cluster屑迂,可以幫助判斷casual SNP的真實(shí)性。

Figure S2

2 利用Mutmap方法對(duì)水稻淺綠色葉片突變體進(jìn)行遺傳分析

作者利用Mutmap方法對(duì)



3 分析流程

所有分析操作均在Mutmap protocol中膘侮,此處僅寫出主要步驟及注意事項(xiàng)屈糊。

1)Protocol、pipeline及數(shù)據(jù)下載

1.1)protocol和pipeline:http://genome-e.ibrc.or.jp/home/bioinformatics-team/mutmapa

Mutmap pipeline和protocol下載

1.2)日本晴參考基因組:

https://rapdb.dna.affrc.go.jp/download/archive/irgsp1/IRGSP-1.0_genome.fasta.gz

http://rice.plantbiology.msu.edu/pub/data/Eukaryotic_Projects/o_sativa/annotation_dbs/pseudomolecules/version_7.0/all.dir/all.chrs.con

1.3)野生型測(cè)序數(shù)據(jù)和突變體混池測(cè)序數(shù)據(jù):

建議使用lftp進(jìn)行下載

如:lftp ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA000/DRA000499 -e "mirror -c --parallel=3;exit"

野生型和混池?cái)?shù)據(jù)下載地址

2)數(shù)據(jù)壓縮及重命名

數(shù)據(jù)壓縮及重命名

重命名的規(guī)則*_[0~9]_[1,2]_sequence.txt.gz

其中*為樣品的名稱或自己想要的標(biāo)記(可將后續(xù)操作中anyname琼了、mybulk目錄修改為*)逻锐,[0~9]為測(cè)序時(shí)flow cell的編號(hào),[1雕薪,2]此處只能填寫1或2昧诱,為雙端測(cè)序的read1和read2。

3)參數(shù)設(shè)置

3.1)建立原始文件鏈接

在/myhome/MutMap_test/1.qualify_read/anyname和cd /myhome/MutMap_test/1.qualify_read/mybulk目錄下所袁,利用ln -s分別建立原始測(cè)序數(shù)據(jù)鏈接 盏档。

3.2)添加參考基因組fasta文件

cp public.fasta /myhome/MutMap_test/downloaded_fasta/

3.3)編輯config.txt修改pipeline參數(shù)

按照protocol中的要求修改~/MutMap_test/config.txt中的參數(shù)。

3.4)運(yùn)行Bat_make_common.fnc.sh文件

./myhome/MutMap_test/Bat_make_common.fnc.sh

運(yùn)行后燥爷,會(huì)在/disk5/mwang/mutmap/MutMap_test/1.qualify_read/anyname(和mybulk)/q30p90/下產(chǎn)生sep_pair目錄蜈亩,對(duì)于后續(xù)運(yùn)行重要。

4)通過SNP替換產(chǎn)生野生型的參考基因組

第一步前翎,利用BWA將過濾后的野生型雙端測(cè)序數(shù)據(jù)比對(duì)到日本晴基因組上稚配。

第二步,用比對(duì)產(chǎn)生的SNP對(duì)日本晴參考基因組進(jìn)行替換港华,產(chǎn)生野生型的參考基因組道川。

第三步,將被過濾的reads

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末立宜,一起剝皮案震驚了整個(gè)濱河市冒萄,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌橙数,老刑警劉巖尊流,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異灯帮,居然都是意外死亡奠旺,警方通過查閱死者的電腦和手機(jī)蜘澜,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來响疚,“玉大人,你說我怎么就攤上這事瞪醋》拊危” “怎么了?”我有些...
    開封第一講書人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵银受,是天一觀的道長(zhǎng)践盼。 經(jīng)常有香客問我,道長(zhǎng)宾巍,這世上最難降的妖魔是什么咕幻? 我笑而不...
    開封第一講書人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任,我火速辦了婚禮顶霞,結(jié)果婚禮上肄程,老公的妹妹穿的比我還像新娘。我一直安慰自己选浑,他們只是感情好蓝厌,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著古徒,像睡著了一般拓提。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上隧膘,一...
    開封第一講書人閱讀 48,970評(píng)論 1 284
  • 那天代态,我揣著相機(jī)與錄音,去河邊找鬼疹吃。 笑死蹦疑,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的互墓。 我是一名探鬼主播必尼,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼篡撵!你這毒婦竟也來了判莉?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤育谬,失蹤者是張志新(化名)和其女友劉穎券盅,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體膛檀,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡锰镀,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年娘侍,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片泳炉。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡憾筏,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出花鹅,到底是詐尸還是另有隱情氧腰,我是刑警寧澤,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布刨肃,位于F島的核電站古拴,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏真友。R本人自食惡果不足惜黄痪,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望盔然。 院中可真熱鬧桅打,春花似錦、人聲如沸轻纪。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽刻帚。三九已至潦嘶,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間崇众,已是汗流浹背掂僵。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留顷歌,地道東北人锰蓬。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像眯漩,于是被迫代替她去往敵國(guó)和親芹扭。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容