基因組中重復(fù)序列大體分為兩類:串聯(lián)重復(fù)(Tandem repeats两入,Tandem Duplication) (TRF可預(yù)測)散在重復(fù)(Dispersed repeats),...
基因組中重復(fù)序列大體分為兩類:串聯(lián)重復(fù)(Tandem repeats两入,Tandem Duplication) (TRF可預(yù)測)散在重復(fù)(Dispersed repeats),...
根據(jù)已有的蛋白庫宝与,對從基因組上提取到的蛋白序列進(jìn)行比對焚廊,從而獲得相應(yīng)的信息。 常用的數(shù)據(jù)庫: Nr:NCBI官方非冗余蛋白數(shù)據(jù)庫习劫,包括PDB, Swiss-Prot, PIR...
Data preparation 繼續(xù)上次的內(nèi)容咆瘟,下載好數(shù)據(jù)后就可以正式開始鑒定了。首先回顧一下诽里,下載好的數(shù)據(jù)袒餐。 基因組序列信息,存儲基因組序列信息的.fasta文件谤狡。還有其...
提取基因?qū)?yīng)的蛋白質(zhì)官方名 最開始灸眼,是需要將基因跟其編碼的蛋白質(zhì)對應(yīng)起來,找遍了各種數(shù)據(jù)庫都沒發(fā)現(xiàn)有相關(guān)的注釋文件墓懂,Uniprot作為處理蛋白質(zhì)的大佬焰宣,結(jié)果里都有,肯定有辦法...
Protein domain: 結(jié)構(gòu)域的概念由Wetlaufer于1973年首次提出捕仔,他定義結(jié)構(gòu)域?yàn)榭梢宰詣诱郫B的穩(wěn)定的蛋白質(zhì)結(jié)構(gòu)單位匕积。過去,結(jié)構(gòu)域被描述為逻澳,折疊單位闸天,致密結(jié)...
最近剛返校,事情比較多斜做,每天也很忙苞氮,之前寫的《基因家族擴(kuò)張與收縮分析及物種進(jìn)化樹構(gòu)建(上)》也一直沒來得及更新,缺少cafe輸出結(jié)果的解讀及后面的可視化瓤逼。最近在簡書上也收到了...
以下是B站生信技能樹GEO數(shù)據(jù)庫挖掘的課程筆記 主要內(nèi)容及學(xué)習(xí)目的: 介紹GEO數(shù)據(jù)庫:了解數(shù)據(jù)存放位置霸旗; 介紹GSE項(xiàng)目的3種下載方式贷帮; 介紹ID轉(zhuǎn)換:使用R語言技巧實(shí)現(xiàn)基...
1精居、基本統(tǒng)計(jì)學(xué)概念 假設(shè)檢驗(yàn)? 零假設(shè)(H0):即原假設(shè)? 備擇假設(shè)(H1):與零假設(shè)對立的假設(shè)? 計(jì)算零假設(shè)(H0)成立的概率? 如果H0成立的概率很低(e.g. 5% o...
參考文章:1.如何統(tǒng)計(jì)BAM文件中的reads數(shù)2.Samtools常用命令的總結(jié) 當(dāng)你有很多個bam文件時,想知道這些bam文件里有多少個比對上的reads淤刃,并且把它們輸出...
RNA-seq或者ChIP-seq等等測序的上游分析流程里的比對步驟相信大家都知道晒他,我之前也只是按照各種教程去走流程,并沒有仔細(xì)的研究過每一步的內(nèi)容钝凶。今天這篇文章學(xué)習(xí)一下sa...