生信完全入門線路圖及資源大全
成為一個合格的生信工程師必經(jīng)之路
6大基礎知識的掌握
首先你需要了解一些測序基礎知識颇蜡,生物學基礎知識辆亏,這個主要靠自己看扮叨,還有平時多積累。
在生信技能樹論壇上面我列了一下碍沐,需要自行花時間自學,遇到不懂的名詞多搜索尘喝,多熟記朽褪。對應我們生信技能樹的論壇版塊是: 生信技能樹?生信技能樹?生信基礎?測序原理-數(shù)據(jù)格式-數(shù)據(jù)庫
然后你需要掌握一門編程語言无虚,可以從<http://www.biotrainee.com/forum-90-1.html> 里面的題目開始骑科,當然你需要先來一些簡單咆爽,你先看這個置森,<http://www.biotrainee.com/thread-834-1-1.html> 編程學會怎么著也得兩三個月了斗埂。對應我們生信技能樹的論壇版塊是:生信技能樹?互動作業(yè)?腳本能力實踐?生信人必練的200個數(shù)據(jù)處理任務
如果是linux,不妨看看實驗樓的練習:
- 全部課程 — >Linux凫海, 新手入門呛凶, 計算機專業(yè)課 — > Linux 基礎入門(新版)
也可以跟著視頻來練習,如果你實在是需要行贪,這里推薦業(yè)界馬哥的視頻教程漾稀,鏈接: <https://pan.baidu.com/s/1slukNwT> 密碼: xyq9
這些基礎掌握的七七八八了,就可以開始NGS組學之旅了建瘫。
NGS組學技術的掌握
首先看 5 篇綜述并翻譯崭捍,涵蓋主流的5個NGS組學技術:WES/RNA-seq/CHIP-seq/miRNA-seq/lncRNA-seq
- Practical Guidelines for the Comprehensive Analysis of ChIP-seq Data : <http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3828144/>
- A survey of tools for variant analysis of next-generation genome sequencing data : <http://bib.oxfordjournals.org/content/15/2/256.short>
- A survey of best practices for RNA-seq data analysis : <http://genomebiology.biomedcentral.com/articles/10.1186/s13059-016-0881-8>
- Online resources for miRNA analysis : <http://www.sciencedirect.com/science/article/pii/S0009912013000994>
- Long non-coding RNA discovery pipeline : <http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0025915>
對應這些組學的PPT也需要自行搜索后瀏覽,掌握概念殷蛇,原理。
然后看5篇測序數(shù)據(jù)分析例子:
- miRNA-seq : RNA expression profiling of human iPSC-derived cardiomyocytes in a cardiac hypertrophy model. : <http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0108051>
- CHIP-seq : CARM1 Methylates Chromatin Remodeling Factor BAF155 to Enhance Tumor Progression and Metastasis <http://www.cell.com/cancer-cell/abstract/S1535-6108(13)00536-9>
- WES : Clinical Whole-Exome Sequencing for the Diagnosis of Mendelian Disorders <http://www.nejm.org/doi/full/10.1056/NEJMoa1306555#t=article>
- LncRNA: Integration of Genome-wide Approaches Identifies lncRNAs of Adult Neural Stem Cells and Their Progeny In Vivo <http://www.sciencedirect.com/science/article/pii/S1934590913000982>
- RNA-seq: RNA-Seq Transcriptome Profiling Identifies CRISPLD2 as a Glucocorticoid Responsive Gene that Modulates Cytokine Function in Airway Smooth Muscle Cells
然后看5篇芯片數(shù)據(jù)分析例子:lncRNA : <http://pubmedcentralcanada.ca/pmcc/articles/PMC3691033/> 橄浓,我就不繼續(xù)羅列了粒梦。
轉(zhuǎn)錄組流程
https://f1000research.com/articles/4-1070/v1
https://f1000research.com/articles/5-1438/v1
https://www.bioconductor.org/help/workflows/rnaseqGene/
當然,實踐這些項目你肯定是需要流程荸实,代碼匀们,在我的github里面已經(jīng)有了,但是你需要掌握了linux准给,軟件安裝等等昼蛀,才能看懂宴猾。我的github地址是: https://github.com/jmzeng1314/NGS-pipeline
等你實踐經(jīng)驗足夠了,你會發(fā)現(xiàn)它們本質(zhì)上都只是數(shù)據(jù)處理而已叼旋,你可以看我以前錄制好的總結視頻:有參組學(全基因組仇哆,全外顯子組學,轉(zhuǎn)錄組學夫植,表觀)的幾個NGS測序數(shù)據(jù)分析的表現(xiàn)形式的異同點讹剔,視頻見騰訊課堂:https://biotree.ke.qq.com/ 敬請關注。
當然详民,我的視頻還有很多延欠,如果你感興趣,可以自行按需下載:我做博客3年來錄制的所有免費視頻, 因為百度云總是禁止我分享沈跨,所以我會慢慢轉(zhuǎn)移到騰訊課堂:https://biotree.ke.qq.com/ 敬請關注由捎。
我還在論壇上面收集整理了很多NGS組學實踐項目,歡迎大家前去練習饿凛,http://www.biotrainee.com/forum-108-1.html狞玛, 這個取決于你的悟性了。
但是如果要真正步入生信的殿堂涧窒,編程其實是少不了的心肪,請繼續(xù)學下去。
關于R語言
知道什么是R語言纠吴,了解基本語法硬鞍,Rstudio編輯器,讀寫文件戴已,跟Excel的區(qū)別固该,繪圖等可視化,生物信息學相關的bioconductor系列包糖儡。
首先下載R語言打印版的 cheatsheet蹬音, 鏈接:<http://pan.baidu.com/s/1nv5Oulb> 密碼:4tsn 放在辦公桌,或者枕頭邊上休玩,隨時瀏覽記憶著淆。然后這里有一個網(wǎng)絡視頻教程,鏈接:<https://pan.baidu.com/s/1slbPogX> 密碼:ga9x 是數(shù)據(jù)分析與R語言視頻教程+課件 請務必抽時間聽完拴疤,一步步跟著操作學習永部,可以保證你R語言能入門。
上面的鏈接可能會被百度云封鎖呐矾,看看這個:鏈接:https://pan.baidu.com/s/1bptknXt 密碼:7tmg 生信入門(包括史上最全R語言資料合集苔埋,北大的生物信息學公開課等) 瀏覽器打開,選擇感興趣有需要的資料下載即可
如果所有的鏈接都失效了蜒犯,你試試看百度云搜索功能组橄,也許可以找到我們新的分享荞膘。
尤為注意的是,初學者千萬不要鉆牛角尖玉工,而是要廣泛涉獵羽资,牢記基礎,應用加實踐遵班,其背后的計算機邏輯算法等可以后期再補屠升,而且要時刻記住,學習R語言是為了分析生物信息學數(shù)據(jù)狭郑。
- 約翰?霍普金斯大學的Bioconductor學習課程
- 斯坦福大學的暑期小課程-用bioconductor做統(tǒng)計分析
- a Little Book of R for Bioinformatics!
- 生物學家應該這樣學R繪圖-視頻腹暖,數(shù)據(jù),代碼全公開
一般不建議初學者直接下載 史上最全R語言資料匯總翰萨,鏈接:https://pan.baidu.com/s/1bptknXt 密碼:7tmg 里面的資料實在是太多了脏答,初學者很容易迷失在里面。但我還是給大家亩鬼,畢竟入門之后的提高殖告,還是用得著的。
關于PYTHON
同樣的辛孵,接下來你應該要開始實踐:
生信技能樹?生信技能樹?互動作業(yè)?腳本能力實踐?生信編程實戰(zhàn)5個月傳送門~~~
需要自己跟著一套視頻來一步步練習丛肮,這里推薦 煉數(shù)成金的python課程 鏈接: <https://pan.baidu.com/s/1bo9WmvX> 密碼: di8q
小成境界
我大概總結了一下:
- 生信菜鳥團 http://www.bio-info-trainee.com/
- 我們的論壇:生信技能樹 http://www.biotrainee.com/thread-1376-1-1.html
- 我們的VIP社區(qū):https://vip.biotrainee.com/d/311-
- 我們的微信公眾號: https://mp.weixin.qq.com/s/egAnRfr3etccU_RsN-zIlg
- 我們的知識星球: https://t.zsxq.com/VjmQZNn
- 我們的騰訊課堂: https://biotree.ke.qq.com/