@小不點打羽毛球 好的,謝謝您滑负!
葉綠體基因組基因、外顯子赠群、內(nèi)含子、基因間隔區(qū)提取Bioinformatic_Scripts/extract_sequences_from_gb_files 一旱幼、用途 從注釋好的gb格式(GenBank Flat File)...
@小不點打羽毛球 好的,謝謝您滑负!
葉綠體基因組基因、外顯子赠群、內(nèi)含子、基因間隔區(qū)提取Bioinformatic_Scripts/extract_sequences_from_gb_files 一旱幼、用途 從注釋好的gb格式(GenBank Flat File)...
@小不點打羽毛球 曲老師查描,您好!問題已經(jīng)自行解決,根據(jù)您提取CDS的腳本柏卤,輸出結(jié)果都是基因名加_加其他信息冬三,我的解決辦法是在給出的list里,每個基因名字后面添加_闷旧,這樣帶數(shù)字的基因名字變成唯一值了,就沒有檢索2時把20钧唐、21忙灼、22這些給檢索到一起的情況了。
另外您是否有rps12兩段連接的腳本钝侠,我現(xiàn)在用的辦法比較笨该园,是從注釋基因那一步,把兩段rps12改名帅韧,提取CDS后里初,建立單基因矩陣,mafft后忽舟,把兩個矩陣拼到一起双妨,改名為rps12用。因為我數(shù)據(jù)量比較大叮阅,大于1000以上刁品,所以手動連接不適用我,我從參考基因那一步嘗試把兩段連在一起浩姥,但是注釋完別的物種挑随,還是分開的,應(yīng)該是您PGA程序的某個參數(shù)默認(rèn)設(shè)定勒叠。
葉綠體基因組基因兜挨、外顯子、內(nèi)含子眯分、基因間隔區(qū)提取Bioinformatic_Scripts/extract_sequences_from_gb_files 一拌汇、用途 從注釋好的gb格式(GenBank Flat File)...
曲老師:您好!
冒昧打擾您了弊决,在使用您的PGA注釋軟件担猛、CDS提取以及單基因提取的腳本時,遇到了一些問題,故特此給您發(fā)郵件詢問一下傅联,問題如下描述:
1先改、使用PGA注釋時,我發(fā)現(xiàn)注釋出來的結(jié)果(使用您提供的參考gb)蒸走,rps12這個基因有一段100多bp的編碼區(qū)仇奶,遠離另外大致位于反向重復(fù)序列上的序列完全相同的rps12編碼區(qū)。當(dāng)使用您的腳本提取CDS區(qū)時比驻,去除重復(fù)后该溯,這一長(300bp左右,末尾是終止密碼子)一短(100多bp别惦,開頭是起始密碼子)編程單獨存在的兩個序列狈茉,無法連成一個完整的基因。
2掸掸、在使用單基因提取的腳本時氯庆,發(fā)現(xiàn)不知什么原因,有些單基因文件里面有其他基因序列扰付,例如提取rpl2時堤撵,rpl2的單基因文件里含有,rpl2羽莺、rpl20实昨、rpl22、rpl23盐固,但是rpl20荒给、rpl22、rpl23這些文件里僅包含各自的基因刁卜。
感謝您的解答锐墙!祝您工作順利。
葉綠體基因組基因长酗、外顯子溪北、內(nèi)含子、基因間隔區(qū)提取Bioinformatic_Scripts/extract_sequences_from_gb_files 一夺脾、用途 從注釋好的gb格式(GenBank Flat File)...
@小不點打羽毛球 好的之拨,謝謝您的解答。
葉綠體基因組注釋軟件PGA使用說明PGA-Plastid Genome Annotator[https://github.com/quxiaojian/PGA] Qu X-J, Moore MJ, Li D-...
曲老師咧叭,您好蚀乔,還想請教您一個問題,咱們PGA注釋出來的結(jié)果菲茬,軟件能否實現(xiàn)在每個LOCUS的下一行添加DEFINITION的結(jié)果吉挣,名字默認(rèn)同LOCUS的一樣就可以派撕。因為注釋完,用您公布的提取CDS的腳本睬魂,后面還得在用其他python腳本把所有物種gb文件按單基因多物種的格式聚集起來终吼,方便后面建樹。之前用到金建軍老師寫的腳本氯哮,直接從gb文件里按一個基因所有物種聚集為一個fasta际跪,依次提取所有基因,一步實現(xiàn)之前兩步功能喉钢,但是金老師的腳本好像是按definition后面的信息提取的姆打,PGA目前注釋結(jié)果里沒有definition這行的信息,Geneious和GeSeq都有這行信息肠虽,因此咨詢下您幔戏,看PGA也能否也呈現(xiàn)definition這一行結(jié)果。
葉綠體基因組注釋軟件PGA使用說明PGA-Plastid Genome Annotator[https://github.com/quxiaojian/PGA] Qu X-J, Moore MJ, Li D-...
@小不點打羽毛球 好的税课,謝謝您
葉綠體基因組注釋軟件PGA使用說明PGA-Plastid Genome Annotator[https://github.com/quxiaojian/PGA] Qu X-J, Moore MJ, Li D-...
我看軟件包里自帶了裸子植物和杯子植物的參考基因組闲延。并為涉及到苔蘚和蕨類這些類群。
葉綠體基因組注釋軟件PGA使用說明PGA-Plastid Genome Annotator[https://github.com/quxiaojian/PGA] Qu X-J, Moore MJ, Li D-...
PGA-Plastid Genome Annotator[https://github.com/quxiaojian/PGA] Qu X-J, Moore MJ, Li D-...
曲老師伯复,您好慨代,用PGA注釋苔蘚植物的葉綠體基因組邢笙,是否也可以像您說的那樣啸如,使用軟件包中提供的無油樟作參考注釋苔蘚的一個研究類群,再用這兩個類群做參考氮惯,來注釋苔蘚的其它類群叮雳。
葉綠體基因組注釋軟件PGA使用說明PGA-Plastid Genome Annotator[https://github.com/quxiaojian/PGA] Qu X-J, Moore MJ, Li D-...