基因組中重復(fù)序列大體分為兩類:串聯(lián)重復(fù)(Tandem repeats,Tandem Duplication) (TRF可預(yù)測)散在重復(fù)(Dispersed repeats),...
基因組中重復(fù)序列大體分為兩類:串聯(lián)重復(fù)(Tandem repeats,Tandem Duplication) (TRF可預(yù)測)散在重復(fù)(Dispersed repeats),...
根據(jù)已有的蛋白庫,對從基因組上提取到的蛋白序列進(jìn)行比對,從而獲得相應(yīng)的信息制圈。 常用的數(shù)據(jù)庫: Nr:NCBI官方非冗余蛋白數(shù)據(jù)庫,包括PDB, Swiss-Prot, PIR...
Data preparation 繼續(xù)上次的內(nèi)容畔况,下載好數(shù)據(jù)后就可以正式開始鑒定了鲸鹦。首先回顧一下,下載好的數(shù)據(jù)跷跪。 基因組序列信息馋嗜,存儲基因組序列信息的.fasta文件。還有其...
提取基因?qū)?yīng)的蛋白質(zhì)官方名 最開始吵瞻,是需要將基因跟其編碼的蛋白質(zhì)對應(yīng)起來葛菇,找遍了各種數(shù)據(jù)庫都沒發(fā)現(xiàn)有相關(guān)的注釋文件,Uniprot作為處理蛋白質(zhì)的大佬橡羞,結(jié)果里都有眯停,肯定有辦法...
Protein domain: 結(jié)構(gòu)域的概念由Wetlaufer于1973年首次提出,他定義結(jié)構(gòu)域為可以自動折疊的穩(wěn)定的蛋白質(zhì)結(jié)構(gòu)單位卿泽。過去莺债,結(jié)構(gòu)域被描述為,折疊單位签夭,致密結(jié)...
最近剛返校齐邦,事情比較多,每天也很忙第租,之前寫的《基因家族擴張與收縮分析及物種進(jìn)化樹構(gòu)建(上)》也一直沒來得及更新侄旬,缺少cafe輸出結(jié)果的解讀及后面的可視化。最近在簡書上也收到了...
以下是B站生信技能樹GEO數(shù)據(jù)庫挖掘的課程筆記 主要內(nèi)容及學(xué)習(xí)目的: 介紹GEO數(shù)據(jù)庫:了解數(shù)據(jù)存放位置; 介紹GSE項目的3種下載方式璧诵; 介紹ID轉(zhuǎn)換:使用R語言技巧實現(xiàn)基...
1、基本統(tǒng)計學(xué)概念 假設(shè)檢驗? 零假設(shè)(H0):即原假設(shè)? 備擇假設(shè)(H1):與零假設(shè)對立的假設(shè)? 計算零假設(shè)(H0)成立的概率? 如果H0成立的概率很低(e.g. 5% o...
參考文章:1.如何統(tǒng)計BAM文件中的reads數(shù)2.Samtools常用命令的總結(jié) 當(dāng)你有很多個bam文件時,想知道這些bam文件里有多少個比對上的reads噪裕,并且把它們輸出...
RNA-seq或者ChIP-seq等等測序的上游分析流程里的比對步驟相信大家都知道蹲盘,我之前也只是按照各種教程去走流程,并沒有仔細(xì)的研究過每一步的內(nèi)容膳音。今天這篇文章學(xué)習(xí)一下sa...