awk 命令使用記錄 例1, 修改fasta序列ID 若后續(xù)只需要用到序列鹦肿,不需要ID的信息禁添,就可以把ID信息完全修改掉 例2:簡化fasta序列名字 ID 修改前后對比 ...
在對拼裝或者數(shù)據(jù)庫下載的序列文件進行下一步分析時个曙,我們通常會對序列進行去冗余操作炭晒,其中經(jīng)常需要提取同一個‘gene’的最長轉(zhuǎn)錄本崎页,所以動手用python寫一個腳本。 一腰埂、基本...
組裝策略 適用于設(shè)計多樣本多物種的組裝屿笼。例如100個樣本牺荠,10個物種。這里如果想直接完成10個de nove組裝驴一,需要將所有樣本數(shù)據(jù)放到一起后休雌,通過樣本信息表聲明每個樣本的物...
對于蛋白的fa文件,由于是每個轉(zhuǎn)錄本對應(yīng)一個蛋白序列肝断。由于后期注釋需要以基因為單位杈曲,因此需要對fa文件進行處理,計算每一個轉(zhuǎn)錄本的蛋白序列長度胸懈,然后提取最長的蛋白序列担扑,該序列...
前言:在對miRNA進行靶標預(yù)測分析時卜壕,需要特定物種的轉(zhuǎn)錄本作為靶向的數(shù)據(jù)庫。通常對miRNA預(yù)測以3'UTR區(qū)域為主烙常,這就需要對轉(zhuǎn)錄本數(shù)據(jù)庫進行UTR區(qū)域的提取轴捎。我在之前寫...
TBtools 是一個集合了超多生信處理的小工具,非常方便,而且是無命令行的操作轮蜕,入門門檻極低。開發(fā)者是華南農(nóng)業(yè)大學(xué)陳程杰博士蝗锥,TBtools文章地址:https://www...
一汇竭、BLAST+(NCBI發(fā)布于2009年) 下載地址:https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATES...
bedtools批量提取基因組指定位置序列 之前已經(jīng)介紹過很多提取序列的方法细燎,有腳本的也有軟件的,這里再介紹一種方法皂甘。 用到軟件是bedtools玻驻,具體方法如下: Optio...
如何從海量高通量測序數(shù)據(jù)中篩選出目標數(shù)據(jù)偿枕?這是困擾大多數(shù)老師的一個難題璧瞬! 小編以一個excel的簡單函數(shù)為例,演示一下如何從表格中快速篩選感興趣的基因等信息渐夸。 函數(shù)的名稱是V...