常用的基因格式
GenBank格式
以LOCUS和一些注釋行開始招刹。
序列的開頭以“ORIGIN”標記程剥,末尾以“//”標記渣锦。
摘自美格基因
EMBL格式
以標識符行(ID)開頭,后面跟著更多注釋行莉掂。
序列的開頭以“SQ”開頭標記,序末尾以“//”標記千扔。
摘自美格基因
Fasta格式:
摘自美格基因
1:以“>”為開頭憎妙,fasta格式標志。
2:序列ID號曲楚,gi號厘唾,NCBI數(shù)據(jù)庫的標識符,具有唯一性龙誊。
格式為:gi|gi號|來源標志|序列標志(接收號抚垃、名稱等),若某項缺失可以留空趟大,“|”保留鹤树。
3:序列描述。
4:堿基序列逊朽,序列中允許空格罕伯、換行、空行叽讳,一般一行60個追他。
測序原理簡介
測序原理