awk 命令使用記錄 例1, 修改fasta序列ID 若后續(xù)只需要用到序列登下,不需要ID的信息,就可以把ID信息完全修改掉 例2:簡化fasta序列名字 ID 修改前后對比 ...
在對拼裝或者數(shù)據(jù)庫下載的序列文件進行下一步分析時,我們通常會對序列進行去冗余操作牍颈,其中經(jīng)常需要提取同一個‘gene’的最長轉(zhuǎn)錄本,所以動手用python寫一個腳本琅关。 一煮岁、基本...
組裝策略 適用于設(shè)計多樣本多物種的組裝画机。例如100個樣本,10個物種新症。這里如果想直接完成10個de nove組裝步氏,需要將所有樣本數(shù)據(jù)放到一起后,通過樣本信息表聲明每個樣本的物...
對于蛋白的fa文件徒爹,由于是每個轉(zhuǎn)錄本對應(yīng)一個蛋白序列荚醒。由于后期注釋需要以基因為單位,因此需要對fa文件進行處理隆嗅,計算每一個轉(zhuǎn)錄本的蛋白序列長度界阁,然后提取最長的蛋白序列,該序列...
前言:在對miRNA進行靶標預(yù)測分析時,需要特定物種的轉(zhuǎn)錄本作為靶向的數(shù)據(jù)庫雌贱。通常對miRNA預(yù)測以3'UTR區(qū)域為主确垫,這就需要對轉(zhuǎn)錄本數(shù)據(jù)庫進行UTR區(qū)域的提取。我在之前寫...
TBtools 是一個集合了超多生信處理的小工具帽芽,非常方便,而且是無命令行的操作翔冀,入門門檻極低导街。開發(fā)者是華南農(nóng)業(yè)大學(xué)陳程杰博士,TBtools文章地址:https://www...
一、BLAST+(NCBI發(fā)布于2009年) 下載地址:https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATES...
bedtools批量提取基因組指定位置序列 之前已經(jīng)介紹過很多提取序列的方法,有腳本的也有軟件的翼悴,這里再介紹一種方法缚够。 用到軟件是bedtools,具體方法如下: Optio...
如何從海量高通量測序數(shù)據(jù)中篩選出目標數(shù)據(jù)谍椅?這是困擾大多數(shù)老師的一個難題! 小編以一個excel的簡單函數(shù)為例古话,演示一下如何從表格中快速篩選感興趣的基因等信息雏吭。 函數(shù)的名稱是V...