cds文件:注釋信息里的蛋白編碼序列
pep文件:cds對應(yīng)序列翻譯成的氨基酸序列
從NCBI上下載基因組時,有的并沒有上傳cds文件和pep文件,此時該怎么辦呢蓬蝶?
(1)利用腳本
①根據(jù)注釋文件提取轉(zhuǎn)錄本:
生信筆記系列之序列提取--根據(jù)GTF提取轉(zhuǎn)錄本
從NCBI基因組數(shù)據(jù)中獲得cds,pep和geneID對應(yīng)表- 薛貓_柳葉 ...
②將cds轉(zhuǎn)換成pep:
從cds到pep
(2)利用cufflinks中的gffread工具
# conda上安裝cufflinks,使用之前激活環(huán)境
source /data1/spider/liupiao/miniconda3/bin/activate
# 提取cds
gffread in.gff3 -g ref.fa -x cds.fa
# 獲得pep
gffread in.gff3 -g ref.fa -y pep.fa