生物信息學(xué)分析和作圖是科研狗們的必備技能川蒙。近幾年贡翘,隨著數(shù)據(jù)類型的增多蹈矮,excel、SPSS等常用軟件已經(jīng)不能滿足科研需求了鸣驱。R語言以其方便泛鸟、快捷的優(yōu)勢(shì),迅速獲得許多編程技術(shù)不好的科研狗的青睞踊东。憑借短短幾行代碼北滥,就能完成各種高大上的數(shù)據(jù)分析,關(guān)鍵還能做出漂亮的圖闸翅。但天天跟代碼打交道也頗為頭疼再芋,作為一般的科研人員,并不需要完全掌握代碼坚冀,只要會(huì)使用生物信息學(xué)網(wǎng)頁工具就差不多了济赎。
1、轉(zhuǎn)錄因子數(shù)據(jù)庫
???????? ooTFD:http://www.ifti.org
2记某、北京大學(xué)生物信息學(xué)中心
???????? http://www.cbi.pku.edu.cn
3联喘、BioEdit?軟件
??????? 核苷酸和蛋白質(zhì)序列分析軟件:http://www.bioedit.com/
4、韋恩圖
??????? Venny2.0
升級(jí)版韋恩圖
jvenn: 可做到6個(gè)
5辙纬、基因預(yù)測
??????? FGENESH
6豁遭、phylogenetic
???????? 進(jìn)化樹:iTOL
?????? 在線構(gòu)建進(jìn)化樹
?????? IQTREE Web Server: Fast and accurate phylogenetic trees under maximum likelihood
7、啟動(dòng)子區(qū)預(yù)測
??????? Promoter Scan
8贺拣、蛋白質(zhì)一級(jí)結(jié)構(gòu)分析
??????? PredictProte
9蓖谢、ExPASy-ProtParam tool
10捂蕴、蛋白質(zhì)磷酸化位點(diǎn)
?????????? NetPhos 2.0
11、信號(hào)肽
?????????? SignalP
12闪幽、跨膜結(jié)構(gòu)域
?????????? TMHMM Server v. 2.0
13啥辨、蛋白質(zhì)亞細(xì)胞定位
?????????? TargetP 1.1 Server
14、蛋白質(zhì)二級(jí)結(jié)構(gòu)分析
?????????? SOPMA
15盯腌、蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測
?????????? SWISS-MODEL
16溉知、短序列拼接
?????????? Cap3
17、多序列比對(duì)相似性展示
?????????? SimiTriX-SimiTetra
18腕够、多序列比對(duì)可視化
??????????? MView: A multiple alignment viewer or AlignmentViewer
19级乍、過濾多序列比對(duì)結(jié)果
??????????? GUIDANCE2 Server: Server for alignment confidence score
20、繪制GO注釋結(jié)果
??????????? WEGO:Web Gene Ontology Annotation Plotting
21帚湘、蛋白質(zhì) Pfam database meme:Multiple Em for Motif Elicitation
?????? SMART Conserved Domains within a protein or coding nucleotide sequence
1. 模體(motif)
屬于蛋白質(zhì)的超二級(jí)結(jié)構(gòu)玫荣,由2個(gè)或2個(gè)以上具有二級(jí)結(jié)構(gòu)的的肽段,在空間上相互接近大诸,形成一個(gè)特殊的空間構(gòu)象捅厂,并發(fā)揮專一的功能。一種類型的模體總有其特征性的氨基酸序列资柔。
模體是二級(jí)結(jié)構(gòu)有規(guī)律的組合焙贷。例如螺旋-環(huán)-螺旋,貝塔折疊的組合贿堰、阿而法螺旋組合等辙芍。再比如亮氨酸拉鏈、鋅指結(jié)構(gòu)都是典型的模體官边,它們執(zhí)行一定的功能沸手,即模體即是結(jié)構(gòu)的單位,又是功能單位注簿,他們可直接作為結(jié)構(gòu)域和三級(jí)結(jié)構(gòu)的建筑塊契吉。某些蛋白質(zhì)因子與DNA大溝結(jié)合的部位靠的就是某些特異的模體。
2. 結(jié)構(gòu)域(domain)
是指在較大的分子(主要指蛋白質(zhì)也包括核酸分子)中形成的某些在空間上可以辨別的結(jié)構(gòu)诡渴,往往是球狀壓縮區(qū)或纖維狀壓縮區(qū)捐晶。它們也既是結(jié)構(gòu)單位,又是功能單位妄辩。例如免疫球蛋白的功能區(qū)就是結(jié)構(gòu)域惑灵。
22、基因組雜合性評(píng)估
?????????? GenomeScope:Estimate genome heterozygosity, repeat content, and size from sequencing reads using a kmer-based statistical?? approach
23眼耀、circos圖
?????????? CIRCOS可以用來畫基因組數(shù)據(jù)的環(huán)狀圖英支,也可以用來繪制其它數(shù)據(jù)的相關(guān)環(huán)狀圖。
1. 需要注意的是上傳數(shù)據(jù)格式為空格或tab分隔的txt格式純文本列表文件哮伟,值均為非負(fù)整數(shù)干花,若存在缺失值妄帘,用“-”線代替,若有小數(shù)池凄,每一個(gè)單元格乘以某一值(如1000)抡驼,化為整數(shù),且每個(gè)單元格中只能有數(shù)字肿仑,其他任何符號(hào)都不行致盟,除了缺失的“-”,(1555尤慰,而不是1,555)馏锡;
2. 在線版只能繪制75階方陣數(shù)據(jù),若需要繪制較復(fù)雜的請(qǐng)下載Circos and use the tableviewer tool割择。
3. 每一個(gè)標(biāo)簽所對(duì)應(yīng)半圈的總長度為這一標(biāo)簽所對(duì)應(yīng)的所有值的和眷篇,不同半圈間連線表示這兩標(biāo)簽所表示的值萎河。
元數(shù)據(jù)可視化
Web-Igloo:Interactively visualizing multivariate data without feature decomposition
需要數(shù)據(jù)和元數(shù)據(jù)兩個(gè)文件,實(shí)例數(shù)據(jù)結(jié)構(gòu)如下:
數(shù)據(jù)(Select data file (Tab delimited))
Samples ? ?Palmitic ? ?Palmitoleic ? ?Stearic ? ?Oleic ? ?Linoleic ? ?Linolenic ? ?Arachidic ? ?Eicosenoic
S1 ? ?1075 ? ?75 ? ?226 ? ?7823 ? ?672 ? ?36 ? ?60 ? ?29
S2 ? ?1088 ? ?73 ? ?224 ? ?7709 ? ?781 ? ?31 ? ?61 ? ?29
S3 ? ?911 ? ?54 ? ?246 ? ?8113 ? ?549 ? ?31 ? ?63 ? ?29
S4 ? ?966 ? ?57 ? ?240 ? ?7952 ? ?619 ? ?50 ? ?78 ? ?35
S5 ? ?1051 ? ?67 ? ?259 ? ?7771 ? ?672 ? ?50 ? ?80 ? ?46
S6 ? ?911 ? ?49 ? ?268 ? ?7924 ? ?678 ? ?51 ? ?70 ? ?44
S7 ? ?922 ? ?66 ? ?264 ? ?7990 ? ?618 ? ?49 ? ?56 ? ?29
S8 ? ?1100 ? ?61 ? ?235 ? ?7728 ? ?734 ? ?39 ? ?64 ? ?35
S9 ? ?1082 ? ?60 ? ?239 ? ?7745 ? ?709 ? ?46 ? ?83 ? ?33
S10 ? ?1037 ? ?55 ? ?213 ? ?7944 ? ?633 ? ?26 ? ?52 ? ?30
S11 ? ?1051 ? ?35 ? ?219 ? ?7978 ? ?605 ? ?21 ? ?65 ? ?24
S12 ? ?1036 ? ?59 ? ?235 ? ?7868 ? ?661 ? ?30 ? ?62 ? ?44
元數(shù)據(jù)(Select metadata (Tab delimited))
Samples ? ?Geography
S1 ? ?N
S2 ? ?N
S3 ? ?N
S4 ? ?NA
S5 ? ?NA
S6 ? ?NA
S7 ? ?NAp
S8 ? ?NAp
S9 ? ?NAp
S10 ? ?NApulia
S11 ? ?NApulia
S12 ? ?NApulia
24荔泳、基因結(jié)構(gòu)展示
?????? GSDS2.0: Gene Structure Display Server
AnnotationSketch
25、外顯子-內(nèi)含子結(jié)構(gòu)
??????????? Exon-Intron Graphic Maker MyDomains DomainDraw draws
蛋白突變位點(diǎn)注釋
MutationMapper: interprets mutations with protein annotations
26虐杯、regulatory genes 分析
Transcription factors, transcription regulators, and chromatin regulators, collectively referred to as regulatory genes.
PlantTFcat: An Online Plant Transcription Factor and Transcriptional Regulator Categorization and Analysis Tool
27玛歌、密碼子偏好性 (Codon Optimization)
?????????? Codon Optimization On-Line (COOL)
????????? Codon Optimization Tool:Integrated DNA Technologies
28、序列格式轉(zhuǎn)換(Sequence Format Conversion)
??????????? EMBOSS Seqret
29擎椰、真菌效應(yīng)蛋白預(yù)測
??????????? EffectorP: predicting fungal effector proteins from secretomes using machine learning
BLAST結(jié)果可視化
kablammo: Visualize your BLAST results
30支子、植物基因家族分類和富集分析
?????????? GenFam: Gene Family based classification and enrichment analysis
31、生物類文件格式轉(zhuǎn)換
?????????? Sequence conversion
32达舒、Plant-Specific Myristoylation Predictor
??????????? Plant-Specific Myristoylation Predictor
33值朋、啟動(dòng)子元件預(yù)測
??????????? Plant CARE: Search for CARE
34、植物啟動(dòng)子/轉(zhuǎn)錄因子分析
??????????? PlantPAN 3.0