最近想自己整理出一套離線的邮屁,方便序列處理的腳本,后來網(wǎng)上查了查菠齿,biopython 可以實(shí)現(xiàn)佑吝,剛好我python 有點(diǎn)基礎(chǔ),就直接學(xué)習(xí)一下绳匀,方便我后續(xù)學(xué)習(xí)芋忿。
安裝使用 pip 安裝
然后主要是看說明,根據(jù)自己的需要使用疾棵,我看英文還是有點(diǎn)吃力啊戈钢,算了,趕時(shí)間是尔,先看中文的說明文檔吧
home https://biopython.org
英文版 http://biopython.org/DIST/docs/tutorial/Tutorial.html
中文版 https://biopython-cn.readthedocs.io/zh_CN/latest/cn/chr06.html
中文版看起來還是很友好的
好了殉了,真正需要的時(shí)候,就是看你要的功能是哪塊拟枚,根據(jù)需要整理再看薪铜。
我這里就是需要能夠讀入fasta文件,然后翻譯為氨基酸
用法如下
from Bio.SeqRecord import SeqRecord
from Bio import SeqIO
def make_protein_record(nuc_record):
"""Returns a new SeqRecord with the translated sequence (default table)."""
return SeqRecord(seq = nuc_record.seq.translate(cds=True), \
id = "trans_" + nuc_record.id, \
description = "translation of CDS, using default table")
from Bio import SeqIO
proteins = (make_protein_record(nuc_rec) for nuc_rec in \
SeqIO.parse("myfile.fasta", "fasta"))
SeqIO.write(proteins, "translations.fasta", "fasta")
這樣就生成了一個(gè)translation的文件了