搞生信的军拟,python和R語言是必不可少的兩種語言, 尤其是python炸裆。
NGS測序數(shù)據(jù)的數(shù)據(jù)量一般都較大,數(shù)據(jù)的分析大都需要使用布置了linux系統(tǒng)的服務(wù)器進(jìn)行分析迁霎。
Linux系統(tǒng)桌面做的一般,數(shù)據(jù)的分析大都需要使用命令行進(jìn)行操作百宇。
Windows中布置python或者R環(huán)境有什么用呢考廉?
對linux系統(tǒng)不熟的初學(xué)者,可以使用此教程在Windows系統(tǒng)中學(xué)習(xí)python或者R語言恳谎;
對已經(jīng)分析好的數(shù)據(jù)結(jié)果進(jìn)行統(tǒng)計及可視化芝此,比如委托第三方分析好的數(shù)據(jù)結(jié)果,NGS原始fastq數(shù)據(jù)太大因痛,個人筆記本的確處理不了,但分析好的結(jié)果數(shù)據(jù)一般不大岸更,個人筆記本完全可以搞定鸵膏。
對常規(guī)的數(shù)據(jù)進(jìn)行統(tǒng)計及可視化,如一些臨床數(shù)據(jù)怎炊,qPCR的數(shù)據(jù)等
學(xué)習(xí)機器學(xué)習(xí)或者深度學(xué)習(xí)建模谭企,找一個數(shù)據(jù)量較小的數(shù)據(jù)集完全可以在個人筆記本電腦進(jìn)行機器學(xué)習(xí)或者深度學(xué)習(xí)的實操練習(xí)。
那么如何在Window中布置python和R語言環(huán)境呢评肆?在這里我推薦使用Jupyter(一個IDE)债查,Jupyter絕對是數(shù)據(jù)科學(xué)家的神器,是數(shù)據(jù)處理瓜挽,數(shù)據(jù)可視化盹廷,機器學(xué)習(xí)建模的不二之選。
其有以下幾個優(yōu)點:
交互性: Jupyter 提供了交互式的編程環(huán)境久橙,可以逐步執(zhí)行代碼并即時查看結(jié)果俄占。這種實時反饋有助于快速迭代和調(diào)試代碼管怠。
可視化: Jupyter 支持內(nèi)聯(lián)可視化,可以在文檔中直接嵌入圖表缸榄、圖形和其他可視化結(jié)果,從而使數(shù)據(jù)分析更具交互性和可視化。
文檔編寫: Jupyter 文檔本身是由文本厂僧、代碼和可視化組成的怜校,因此非常適合編寫數(shù)據(jù)分析報告、教學(xué)材料和技術(shù)文檔鹰贵。您可以在同一個環(huán)境中結(jié)合代碼和解釋性文本晴氨,使得代碼更易于理解和分享。
多語言支持: 雖然 Jupyter 在 Python 社區(qū)中應(yīng)用廣泛砾莱,但它也支持其他編程語言瑞筐,例如 R、Julia 和 Scala腊瑟。這使得 Jupyter 成為一個多用途的工具聚假,可用于各種數(shù)據(jù)科學(xué)和計算任務(wù)。
可擴展性: Jupyter 是一個開源項目闰非,具有強大的社區(qū)支持和活躍的開發(fā)者生態(tài)系統(tǒng)膘格。您可以通過安裝各種插件和擴展來擴展 Jupyter 的功能,以滿足特定需求和工作流程财松。
如何安裝Jupyter呢瘪贱?我推薦使用Anaconda(安裝包下載地址:https://www.anaconda.com/download/success):
下載好安裝包后,直接點擊安裝即可辆毡,推薦安裝到C盤以外的其它盤菜秦,其它設(shè)置無需修改。安裝好之后舶掖,Anaconda會讓你注冊一個賬號球昨,隨意,不注冊也不影響使用眨攘。
打開Anaconda后主慰,需要創(chuàng)建一個同時包含python和R語言的新環(huán)境(依次點擊下圖紅框的中的兩個,python和R都選擇上):
等待安裝好即可鲫售,安裝好之后進(jìn)入該環(huán)境共螺,再啟動主頁的JupyterLab(下圖紅框,JupyterLab是更易使用的Notebook版本):
啟動JupyterLab后情竹,其會在系統(tǒng)默認(rèn)瀏覽器中打開一個窗口:
點擊紅框內(nèi)的python3或者R語言內(nèi)核藐不,即可啟動基于Jupyter notebook的python/R運行界面了,下面以python為例(下圖中左側(cè)為文件夾區(qū)域,默認(rèn)為C盤用戶目錄,右面為代碼區(qū)):
可以點擊File下拉菜單中的“Save Notebook As”佳吞,修改一下文件名:
其默認(rèn)在C盤中的目標(biāo)用戶目錄下拱雏,會生成目標(biāo)的ipynb后綴文件,下次打開可繼續(xù)運行底扳。
下面就可以開始碼代碼了:首先介紹一下按鍵功能:
其它不必說铸抑,代碼塊性質(zhì)有三個選項(Code/MarkDown/Raw):Code就是代碼,MarkDown就是支持MarkDown格式的文本衷模,如(兩個#號+空格+文字在MarkDown中表示二級標(biāo)題):
另外支持代碼自動補全:
隨便生成數(shù)據(jù)測試一下(下圖中第一個代碼塊導(dǎo)入所需要的包鹊汛,第二個代碼塊先生成兩個0,1,2-9的Array并分別賦值給x,y阱冶,然后使用x刁憋,y繪制了一個折線圖,橫坐標(biāo)為x木蹬,縱坐標(biāo)為y):
如果你需要的某一個python包沒有安裝至耻,直接在Notebook中運行安裝命令即可(下圖):
也可在Anaconda目標(biāo)環(huán)境界面進(jìn)行手動搜索安裝,下圖中兩個紅框镊叁,選擇未安裝尘颓,并搜索目標(biāo)安裝包:
Jupyter對于python的支持已經(jīng)非常好了,但是對于R語言還是有些差強人意晦譬。R語言推薦使用RStudio疤苹,Anaconda中已經(jīng)兼容RStudio,直接安裝運行即可(安裝時會提示需要建一個RStudio單獨的環(huán)境敛腌,確認(rèn)即可):
進(jìn)入RStudio環(huán)境并在主界面啟動RStudio(上圖紅框)卧土,就會進(jìn)入RStudio的界面(下圖),就可直接測試R語言代碼了像樊。
如果你是小白尤莺,不知道如何選擇python或者R語言。直接無腦選擇python即可生棍,python代碼更加易懂缝裁,并且對于機器學(xué)習(xí)和深度學(xué)習(xí)有更好的支持。
生信相關(guān)數(shù)據(jù)分析python都可以搞定足绅,只是進(jìn)行某些繪圖/統(tǒng)計時,R語言會更好用一些韩脑。
趕快行動試試吧氢妈。