奮斗在人類組學(xué)數(shù)據(jù)分析的一線贮尉,要隨時跟上最新的研究進展。大型的研究項目會有全面的數(shù)據(jù)集和可視化工具哥谷,也有專門從各個數(shù)據(jù)源收集數(shù)據(jù)整合而成的數(shù)據(jù)庫岸夯。手頭備幾個,方便查閱们妥。
Genetic和Epigenetic數(shù)據(jù)查詢與下載
GeneCards (http://www.genecards.org/) 使用125個數(shù)據(jù)源對人類基因組基因進行詳細(xì)注釋
ENCODE data portal (https://www.encodeproject.org/)
- ENCODE Phase 3和ENCODE Phase 4的數(shù)據(jù)庫
- 常用細(xì)胞系和組織的各類組學(xué)數(shù)據(jù)
ENCODE Downloads (http://genome.ucsc.edu/encode/downloads.html)
- ENCODE phase 2數(shù)據(jù)下載頁面
ICGC Data Portal (https://dcc.icgc.org/) 最全的癌癥項目數(shù)據(jù)庫猜扮,包含TCGA的數(shù)據(jù)
COSMIC (http://cancer.sanger.ac.uk/cosmic) 人工注釋癌癥樣本中的Somantic Mutation大全
BioMart (https://www.ensembl.org/biomart/martview/1fbe827446e53d1a0f34002043ac4dfa) 在線注釋基因組信息(R中有biomaRt包實現(xiàn)同樣功能)
Firebrowse (http://firebrowse.org/) TCGA數(shù)據(jù)分析展示的工具
非編碼基因組(noncoding genome)的相關(guān)數(shù)據(jù)庫
- 隨著ENCODE計劃從Phase 2到Phase 4不斷推進,大家發(fā)現(xiàn)基因組絕大部分是不編碼的监婶,再加上基因編輯技術(shù)更新?lián)Q代旅赢,這些nocoding genome的功能研究一直如火如荼。從短的(miRNA惑惶,siRNA等)到長的(lncRNA)煮盼,再到成環(huán)的(circRNA),無所不能...
Noncode (http://www.noncode.org/) 陳潤生院士課題組開發(fā)的带污,網(wǎng)站功能全面
Lncipeda (https://lncipedia.org/) 數(shù)據(jù)來源十分廣泛
Lncrnadb (http://lncrnadb.com/) 完全手動收集僵控,每一個條目有對應(yīng)文獻
GWAS Catalog (https://www.ebi.ac.uk/gwas/) 完全手動收集的GWAS SNP,每一個有對應(yīng)文獻
基因組瀏覽器
UCSC genome browser (https://genome.ucsc.edu/)
- 人類基因組計劃時代開發(fā)的browser鱼冀,頁面較簡陋报破,但數(shù)據(jù)仍在不斷更新
WashU Browser (http://epigenomegateway.wustl.edu/)
- 云端有ENCODE項目和Roadmap項目的全部數(shù)據(jù)
- 可以上傳自己的數(shù)據(jù),也有截圖功能產(chǎn)生矢量圖片
- 支持三維基因組學(xué)數(shù)據(jù)的可視化(比如Hi-C和ChIAPET)
IGV (http://www.igv.org/) 包括桌面瀏覽器和javascript兩個版本
- 桌面瀏覽器本地運行千绪,適合可視化大文件(如bam文件)充易,也可以加載來自ENCODE, TCGA,1000 Genomics的云端數(shù)據(jù)
- javascript版本IGV.js可以直接嵌入其他web應(yīng)用里
HiGlass (http://higlass.io/) 4D Nucleome項目官方瀏覽器
- 不僅能可視化組學(xué)數(shù)據(jù)(比如ChIP-Seq和RNA-Seq)荸型,還支持Hi-C交互矩陣的可視化
常用軟件
OMICTools (https://omictools.com/) 生物信息學(xué)軟件收集
Bioconductor (https://www.bioconductor.org/) 生物信息學(xué)R package大本營
問答社區(qū)
Biostars (https://www.biostars.org/) 軟件報錯的時候
SEQanswers(http://seqanswers.com/) 軟件報錯的時候
Stackoverflow (https://stackoverflow.com/) 代碼報錯的時候
在線課程
Bioinformatics Specialization UCSD開設(shè)的計算生物學(xué)課程盹靴,從算法角度解決生物學(xué)問題
Data Analysis for Life Sciences 哈佛開設(shè)的統(tǒng)計分析課程,針對生命科學(xué)背景的研究人員
暫時想到的就是這么多瑞妇,以后再更新...