Kraken軟件可以通過(guò)序列對(duì)樣本進(jìn)行物種注釋融痛,kraken2在該軟件基礎(chǔ)之上做了一些更新怠惶,其中包括注釋的加速魏保、支持氨基酸序列的注釋等其他特性。...
正則表達(dá)式使用一些既定的表達(dá)式來(lái)實(shí)現(xiàn)文本檢索和其他字符串處理的功能矗晃,在python中,re模塊可以使用正則表達(dá)式能夠快速的提取目標(biāo)文本、文本替換...
我們?cè)诜治鰷y(cè)序數(shù)據(jù)或者下載數(shù)據(jù)庫(kù)數(shù)據(jù)時(shí)腹纳,經(jīng)常需要合并數(shù)據(jù)。期間不可避免的出現(xiàn)重復(fù)序列驱犹,為了減少減少后續(xù)資源的使用嘲恍,更快速地分析數(shù)據(jù),往往需要先對(duì)...
隨著測(cè)序技術(shù)的普及和組裝技術(shù)的完善雄驹,物種基因組版本更新很快蛔钙。如果我們手頭的數(shù)據(jù)是使用老版本基因組分析的結(jié)果,可以使用現(xiàn)成的工具直接轉(zhuǎn)換(轉(zhuǎn)換會(huì)有...
在基因家族分析中荠医,hmmsearch用來(lái)在很多候選序列中尋找具有某種基因家族結(jié)構(gòu)域的蛋白吁脱。在尋找時(shí),需要提供基因家族對(duì)應(yīng)的隱馬模型彬向。前段時(shí)間給大...
在基因家族分析中兼贡,通過(guò)pfam數(shù)據(jù)庫(kù)檢索獲得已知基因家族的hmm模型(隱馬模型)是必不可少的一步,最近發(fā)現(xiàn)pfam數(shù)據(jù)庫(kù)有變動(dòng)娃胆,和大家分享一下遍希。...
三代測(cè)序因?yàn)殚L(zhǎng)讀長(zhǎng)的特點(diǎn),在基因組組裝方面有明顯的優(yōu)勢(shì)里烦。今天給大家介紹一款基因組組裝軟件凿蒜,miniasm。該軟件可用于Pacbio和ONT兩個(gè)平...
之前寫過(guò)一篇如何使用blast+套件進(jìn)行本地blast庫(kù)的創(chuàng)建及比對(duì)胁黑,今天跟大家聊聊比對(duì)結(jié)果的輸出格式废封。 比對(duì)命令 通過(guò)outfmt參數(shù)指定輸出...
之前寫過(guò)一篇如何使用blast+套件進(jìn)行本地blast庫(kù)的創(chuàng)建及比對(duì),今天跟大家聊聊比對(duì)結(jié)果的輸出格式丧蘸。 比對(duì)命令 通過(guò)outfmt參數(shù)指定輸出...