七. 植物葉綠體基因組--組裝,注釋和比較作圖(GetOrganelle通惫,GeSeq茂翔,Chloroplot,IRscope)

一. 簡介

  1. 葉綠體是綠色植物履腋,藻類和藍(lán)細(xì)菌進行光合作用的場所珊燎,光合作用將水和二氧化碳轉(zhuǎn)變?yōu)橛袡C化合物并放出氧氣。葉綠體所攜帶遺傳物質(zhì)DNA遵湖,以原核細(xì)胞的編碼方式轉(zhuǎn)錄合成一些自身需要的RNA與蛋白質(zhì)悔政。葉綠體通過分裂方式增殖,通過細(xì)胞質(zhì)遺傳傳遞給后代(也叫母體遺傳延旧、單一親本遺傳谋国、非孟德爾遺傳等)。內(nèi)共生起源學(xué)說認(rèn)為葉綠體源于原始真核細(xì)胞內(nèi)共生的藍(lán)藻迁沫。
    葉綠體起源(來自百度圖片).jpg
  2. 植物葉綠體由LSC, IR, SSC, IR四部分組成芦瘾,為典型四分體結(jié)構(gòu)捌蚊,四分體結(jié)構(gòu)翻轉(zhuǎn)構(gòu)造形成同分異構(gòu)體,一般組裝得到的葉綠體會得到兩條序列近弟,主要是SSC順序的顛倒缅糟,可以通過比較選擇順序一致的序列進行后續(xù)分析。

參考文獻: Palmer, Jeffrey D . Chloroplast DNA exists in two orientations[J]. Nature, 1983, 301(5895):92-93.

微管植物質(zhì)體基因組特征(版納所郁文彬老師提供圖片).png

二. 組裝

GetOrganelle是中國科學(xué)院昆明植物研究所金建軍郁文彬兩位老師共同開發(fā)的質(zhì)體組裝軟件祷愉,論文發(fā)表在Genome Biology溺拱,其中葉綠體基因組組裝方法如下:
首先,通過conda安裝GetOrganelle:

[abc@Server GetOrg]$ conda install -c bioconda getorganelle

安裝完成后谣辞,下載參考序列庫:

[abc@Server GetOrg]$ get_organelle_config.py --add embplant_pt,embplant_mt

注意:這里可能會出現(xiàn)報錯:Bowtie2 is not available!迫摔,可以通過conda重新安裝Bowtie2,然后升級到最新版本泥从,如果不成功的話刪除conda環(huán)境中的Bowtie2相關(guān)文件(rm ~/.conda/envs/getorganelle/bin/Bowtie2*)句占,下載安裝Bowtie2并添加環(huán)境變量中。
然后躯嫉,運行 GetOrganelle(約2個小時左右):

[abc@Server GetOrg]$ get_organelle_from_reads.py -1 a.fq.gz -2 b.fq.gz -t  10 -o abc_plastome -F embplant_pt -R 10

生成文件中:embplant_pt.K85.complete(scaffolds).graph1.1.path_sequence.fasta和embplant_pt.K85.complete(scaffolds).graph1.2.path_sequence.fasta即為做得到的葉綠體基因組纱烘,其中K85表示選擇的kmer為85,complete表明組裝得到環(huán)狀基因組祈餐,scaffolds或Contigs表示不止一條序列(未拼接成環(huán))擂啥。一般GetOrganelle組裝會得到兩個環(huán),graph1.1和graph1.2帆阳,這是因為存在同分異構(gòu)體哺壶,可以通過和模式植物比較選擇順序一致的進行后續(xù)分析。

三. 注釋

上文得到的葉綠體基因組可以利用在線軟件GeSeq進行注釋:

GeSeq.jpg

上傳序列文件蜒谤,勾選相關(guān)內(nèi)容山宾,其中輸出格式選GenBank格式便于后續(xù)作圖,然后點提交鳍徽,運行完后下載GenBank注釋文件资锰。
注意:利用GeSeq得到的GenBank文件在后續(xù)“五. 邊界可視化作圖”的時候IRscope軟件出現(xiàn)報錯,后面試了另一個在線注釋軟件CPGAVAS阶祭,注釋得到的GenBank文件IRscope不會報錯绷杜。
CPGAVAS的具體教程參照:教程 | 使用 CPGAVAS2 進行葉綠體基因組注釋

四. 圈圖和線圖

利用在線軟件Chloroplot進行葉綠體基因組作圖:

Chloroplot.jpg

可以選擇輸入Accession Number或上傳GenBank 文件濒募,這里我從NCBI下載 Manihot esculenta葉綠體基因組序列進行測試鞭盟,利用前文GeSeq軟件進行注釋,得到GenBank 注釋文件萨咳,和直接輸入Accession Number:EU117376.1兩種方式進行比較懊缺,結(jié)果基本一致:
Chloroplot_ Manihot esculenta.png

另外,還有一個在線軟件OGDRAW,可以畫圈圖或線性圖,其中線性圖更方便將多個圖放一起進行比較鹃两,輸入文件可以利用上文CPGAVAS注釋軟件輸出的gbf文件遗座,輸出的線狀圖如下(線狀圖通過AI整合):
OGDRAW.png

五. 邊界可視化作圖

IRscope是一種葉綠體基因組連接位點和邊界區(qū)域基因可視化工具。

IRscope.jpg

可以輸入Accession No.或GeneBank注釋文件俊扳,以擬南芥(NC_000932)和楊樹(NC_009143)作為輸入文件途蒋,結(jié)果如下:
NC_000932 and NC_009143.jpg

注意:在比較分析時可能會出現(xiàn)LSC區(qū)域顛倒的情況,可以在組裝的時候加上--reverse-lsc參數(shù)馋记。

六. 構(gòu)建進化樹

通過上述四和五号坡,同模式植物葉綠體基因組進行比較,確定合適的構(gòu)型和對應(yīng)的參數(shù)梯醒,比如:我在組裝葉綠體的時候發(fā)現(xiàn)組裝的兩種構(gòu)型都和楊樹宽堆、擬南芥的順序不一致,有一個比較接近但LSC順序是顛倒的茸习,這時通過金建軍老師的提示畜隶,在組裝的時候加上參數(shù)--reverse-lsc,這樣就就得到和模式植物順序較一致的序列号胚,接下來就可以用葉綠體基因組構(gòu)建進化樹籽慢。
首先,將得到的葉綠體基因組合并成一個fasta格式的文件:

[abc@Server]$ ll|grep CRR|awk '{print"cat "$NF"/*complete.graph1.1.path_sequence.fasta >Result/"$NF"_1"}'|sh
[abc@Server]$ ll|grep CRR|awk '{print"cat "$NF"/*complete.graph1.2.path_sequence.fasta >Result/"$NF"_2"}'|sh
[abc@Server]$ cd Result/
[abc@Server]$ ll|grep xiaoxh|awk '{print"sed -i \0471i\\"$NF"\047 "$NF}'|sh
[abc@Server]$ cat * >abc_cp.fas
[abc@Server]$ more abc_cp.fas|grep -v '>'|sed 's/CRR/>CRR/g' >Tree.fas

主要通過awk和sh實現(xiàn)猫胁,先將生成的graph1.1和graph1.2 cp到一個文件夾并命名為_1和_2箱亿,然后利用sed在每個文件第一行加上新的序列名不帶“>”,將所有序列合并弃秆,grep -v去掉舊的序列名届惋,利用sed給新的序列名加上 “>”,方法可能過于繁瑣驾茴。
然后盼樟,利用mafft進行多序列比對氢卡,利用iqtree建樹:

[abc@Server]$ nohup mafft --auto Tree.fas >Tree.fas.mafft 2>Tree.fas.mafft.log&
[abc@Server]$ nohup iqtree -s Tree.fas.mafft -m MFP -bb 1000  -bnni -redo -o NC_010433 &
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末锈至,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子译秦,更是在濱河造成了極大的恐慌峡捡,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件筑悴,死亡現(xiàn)場離奇詭異们拙,居然都是意外死亡,警方通過查閱死者的電腦和手機阁吝,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門砚婆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事装盯】缆牵” “怎么了?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵埂奈,是天一觀的道長迄损。 經(jīng)常有香客問我,道長账磺,這世上最難降的妖魔是什么芹敌? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮垮抗,結(jié)果婚禮上氏捞,老公的妹妹穿的比我還像新娘。我一直安慰自己冒版,他們只是感情好幌衣,可當(dāng)我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著壤玫,像睡著了一般豁护。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上欲间,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天楚里,我揣著相機與錄音,去河邊找鬼猎贴。 笑死班缎,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的她渴。 我是一名探鬼主播达址,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼趁耗!你這毒婦竟也來了沉唠?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤苛败,失蹤者是張志新(化名)和其女友劉穎满葛,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體罢屈,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡嘀韧,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了缠捌。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片锄贷。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出谊却,到底是詐尸還是另有隱情蹂随,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布因惭,位于F島的核電站岳锁,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏蹦魔。R本人自食惡果不足惜激率,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望勿决。 院中可真熱鬧乒躺,春花似錦、人聲如沸低缩。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽咆繁。三九已至讳推,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間玩般,已是汗流浹背银觅。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留坏为,地道東北人究驴。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像匀伏,于是被迫代替她去往敵國和親洒忧。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容