重測序獲取基因編輯植物T-DNA插入位點(diǎn)

早在本科學(xué)習(xí)比較基因組學(xué)期間就有意做一些知識(shí)分享设易,畢竟目前學(xué)得的七成生信知識(shí)是源自最早做知識(shí)分享的前輩們工三。計(jì)劃一直夭折,一方面是自覺實(shí)力有限炸宵,怕誤人子弟,一方面是有點(diǎn)空閑時(shí)間就想偷個(gè)懶谷扣。個(gè)人是希望做到干濕結(jié)合全面發(fā)展的土全,如果不想兩邊都學(xué)個(gè)半吊子,那必然得付出雙倍努力了会涎。我目前主要做倆物種裹匙,異源多倍體油菜和同源多倍體馬鈴薯,方向涉及多組學(xué)分析末秃、細(xì)胞遺傳和基因編輯概页。


回歸正題,基因編輯過的作物會(huì)有載體序列插入到植物基因組中练慕,確定T-DNA插入位點(diǎn)有重要用處惰匙,原理可以看一下這篇文章Illumina Sequencing Technology as a Method of Identifying T-DNA Insertion Loci in Activation-Tagged?Arabidopsis thaliana?Plants。下面介紹我是如何完成這項(xiàng)工作的铃将,有些內(nèi)容比如軟件安裝和參數(shù)設(shè)置项鬼,網(wǎng)上已經(jīng)有太多教程,這里就不啰嗦啦劲阎。

1绘盟、提取DNA二代測序,PE150悯仙,深度10X以上(太低可能檢測不到)龄毡。

2、過濾reads得到cleandata锡垄。

3沦零、創(chuàng)建樣本名文件samplename.txt,一個(gè)名字一行货岭。

4蠢终、運(yùn)行腳本

#!/bin/bash

#載體序列作為參考基因組,建索引

bwa index TDNA.fa

samtools faidx TDNA.fa

#讀入樣本茴她,寫個(gè)循環(huán)

cat samplename.txt | while read line

do

read1="${line}_1.clean.fq.gz"

read2="${line}_2.clean.fq.gz"

#bwa比對(duì)并samtools排序轉(zhuǎn)成bam文件

bwa mem -t 12 -R "@RG\tID:$line\tSM:$line\tLB:$line\tPL:ILLUMINA" TDNA.fa $read1 $read2 | samtools sort -@ 12 -o $line.sorted.bam

#samtools建索引,提取比對(duì)上的信息程奠,保存sam格式

samtools index -@ 12 $line.sorted.bam

samtools view $line.sorted.bam TDNA > $line.TDNA.sam

#提取比對(duì)上的reads的ID丈牢,根據(jù)ID從原始測序數(shù)據(jù)中提取這些reads

cut -f1 $line.TDNA.sam |sort|uniq > $line.TDNA.ID

seqtk subseq $read1 $line.TDNA.ID > ${line}_1.TDNA.fq

seqtk subseq $read2 $line.TDNA.ID > ${line}_2.TDNA.fq

#spades組裝到contig水平,contigs.fasta即為最終結(jié)果

spades.py --careful -1 ${line}_1.TDNA.fq -2 ${line}_2.TDNA.fq -o ${line}spades

done

5瞄沙、將contigs與載體序列blastn(圖1)己沛,比對(duì)不上的序列再和植物基因組blastn(圖2)慌核,即可找到插入位點(diǎn)。


圖1


圖2



精力有限申尼,難免出錯(cuò)垮卓,轉(zhuǎn)載請(qǐng)注明出處。有任何疑問师幕,歡迎交流討論粟按。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市霹粥,隨后出現(xiàn)的幾起案子灭将,更是在濱河造成了極大的恐慌,老刑警劉巖后控,帶你破解...
    沈念sama閱讀 217,277評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件庙曙,死亡現(xiàn)場離奇詭異,居然都是意外死亡浩淘,警方通過查閱死者的電腦和手機(jī)捌朴,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來张抄,“玉大人砂蔽,你說我怎么就攤上這事⌒辣睿” “怎么了察皇?”我有些...
    開封第一講書人閱讀 163,624評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長泽台。 經(jīng)常有香客問我什荣,道長,這世上最難降的妖魔是什么怀酷? 我笑而不...
    開封第一講書人閱讀 58,356評(píng)論 1 293
  • 正文 為了忘掉前任稻爬,我火速辦了婚禮,結(jié)果婚禮上蜕依,老公的妹妹穿的比我還像新娘桅锄。我一直安慰自己,他們只是感情好样眠,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,402評(píng)論 6 392
  • 文/花漫 我一把揭開白布友瘤。 她就那樣靜靜地躺著,像睡著了一般檐束。 火紅的嫁衣襯著肌膚如雪辫秧。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,292評(píng)論 1 301
  • 那天被丧,我揣著相機(jī)與錄音盟戏,去河邊找鬼绪妹。 笑死,一個(gè)胖子當(dāng)著我的面吹牛柿究,可吹牛的內(nèi)容都是我干的邮旷。 我是一名探鬼主播,決...
    沈念sama閱讀 40,135評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼蝇摸,長吁一口氣:“原來是場噩夢啊……” “哼婶肩!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起探入,我...
    開封第一講書人閱讀 38,992評(píng)論 0 275
  • 序言:老撾萬榮一對(duì)情侶失蹤狡孔,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后蜂嗽,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體苗膝,經(jīng)...
    沈念sama閱讀 45,429評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,636評(píng)論 3 334
  • 正文 我和宋清朗相戀三年植旧,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了辱揭。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,785評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡病附,死狀恐怖问窃,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情完沪,我是刑警寧澤域庇,帶...
    沈念sama閱讀 35,492評(píng)論 5 345
  • 正文 年R本政府宣布,位于F島的核電站覆积,受9級(jí)特大地震影響听皿,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜宽档,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,092評(píng)論 3 328
  • 文/蒙蒙 一尉姨、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧吗冤,春花似錦又厉、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至肺蔚,卻和暖如春篷朵,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評(píng)論 1 269
  • 我被黑心中介騙來泰國打工声旺, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人段只。 一個(gè)月前我還...
    沈念sama閱讀 47,891評(píng)論 2 370
  • 正文 我出身青樓腮猖,卻偏偏與公主長得像,于是被迫代替她去往敵國和親赞枕。 傳聞我的和親對(duì)象是個(gè)殘疾皇子澈缺,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,713評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容