基因組中重復(fù)序列大體分為兩類:串聯(lián)重復(fù)(Tandem repeats,Tandem Duplication) (TRF可預(yù)測)散在重復(fù)(Dispersed repeats),...
基因組中重復(fù)序列大體分為兩類:串聯(lián)重復(fù)(Tandem repeats,Tandem Duplication) (TRF可預(yù)測)散在重復(fù)(Dispersed repeats),...
根據(jù)已有的蛋白庫,對從基因組上提取到的蛋白序列進行比對板壮,從而獲得相應(yīng)的信息逗鸣。 常用的數(shù)據(jù)庫: Nr:NCBI官方非冗余蛋白數(shù)據(jù)庫,包括PDB, Swiss-Prot, PIR...
Data preparation 繼續(xù)上次的內(nèi)容个束,下載好數(shù)據(jù)后就可以正式開始鑒定了慕购。首先回顧一下,下載好的數(shù)據(jù)茬底。 基因組序列信息,存儲基因組序列信息的.fasta文件获洲。還有其...
提取基因?qū)?yīng)的蛋白質(zhì)官方名 最開始阱表,是需要將基因跟其編碼的蛋白質(zhì)對應(yīng)起來,找遍了各種數(shù)據(jù)庫都沒發(fā)現(xiàn)有相關(guān)的注釋文件贡珊,Uniprot作為處理蛋白質(zhì)的大佬最爬,結(jié)果里都有,肯定有辦法...
Protein domain: 結(jié)構(gòu)域的概念由Wetlaufer于1973年首次提出门岔,他定義結(jié)構(gòu)域為可以自動折疊的穩(wěn)定的蛋白質(zhì)結(jié)構(gòu)單位爱致。過去,結(jié)構(gòu)域被描述為寒随,折疊單位糠悯,致密結(jié)...
最近剛返校,事情比較多妻往,每天也很忙互艾,之前寫的《基因家族擴張與收縮分析及物種進化樹構(gòu)建(上)》也一直沒來得及更新,缺少cafe輸出結(jié)果的解讀及后面的可視化讯泣。最近在簡書上也收到了...
以下是B站生信技能樹GEO數(shù)據(jù)庫挖掘的課程筆記 主要內(nèi)容及學(xué)習(xí)目的: 介紹GEO數(shù)據(jù)庫:了解數(shù)據(jù)存放位置好渠; 介紹GSE項目的3種下載方式昨稼; 介紹ID轉(zhuǎn)換:使用R語言技巧實現(xiàn)基...
1晌畅、基本統(tǒng)計學(xué)概念 假設(shè)檢驗? 零假設(shè)(H0):即原假設(shè)? 備擇假設(shè)(H1):與零假設(shè)對立的假設(shè)? 計算零假設(shè)(H0)成立的概率? 如果H0成立的概率很低(e.g. 5% o...
參考文章:1.如何統(tǒng)計BAM文件中的reads數(shù)2.Samtools常用命令的總結(jié) 當(dāng)你有很多個bam文件時,想知道這些bam文件里有多少個比對上的reads拍棕,并且把它們輸出...
RNA-seq或者ChIP-seq等等測序的上游分析流程里的比對步驟相信大家都知道晓铆,我之前也只是按照各種教程去走流程,并沒有仔細的研究過每一步的內(nèi)容绰播。今天這篇文章學(xué)習(xí)一下sa...