先是在網(wǎng)上找到一堆資料抒巢,同時配合馬哥的視頻在理解這個語言贫贝。
參考學(xué)習(xí)資料:Python 入門指南中文版
這個語言的重要性,不用我來強調(diào)了,反正現(xiàn)在要用到稚晚,那就只有學(xué)習(xí)了崇堵,好在前面學(xué)習(xí)了R,和linux基礎(chǔ)的知識客燕,現(xiàn)在學(xué)習(xí)Python感覺并沒有太難鸳劳,總的來講Python就是綜合了R和Linux的一些優(yōu)點,比較人性化的讓人和計算機溝通的一種工具也搓。Python也是有很多擴展包的支持赏廓,跟R特別像,還有函數(shù)傍妒,變量等等很多都是類似的幔摸。
在菜鳥團的推送也有學(xué)習(xí)目錄生信分析方向如何系統(tǒng)入門python3(2019持續(xù)更新)
第一步 安裝編碼解釋器PyCharm
非專業(yè)選手,選擇下載python https://www.python.org/downloads/中的Community社區(qū)版本颤练。
這個PyCharm基本上就跟RStudio差不多的一個軟件既忆,可以新建一個腳本,寫代碼一行行調(diào)試嗦玖,調(diào)用各種包及相應(yīng)的函數(shù)尿贫。整個操作過程基本上和RStudio差不多。
估計單純的R和終端的Python shell差不多踏揣。因為一直用RStudio不太清楚。
安裝教程:https://www.jetbrains.com/help/pycharm/installation-guide.html
第一次安裝使用點擊最下面的Run PyCharm for the first time.
安裝過程中如有必要下載相應(yīng)的插件匾乓,就在上面那個官方網(wǎng)站下載即可捞稿。
完整的中文教程及使用原則如下:
三劍客 PyCharm安裝測試
第二步 使用PyCharm創(chuàng)建一個任務(wù)進程
創(chuàng)建和管理Projects
基本上和創(chuàng)建一個.Rproj
過程一樣創(chuàng)建一個.idea
一個虛擬內(nèi)存環(huán)境,然后在創(chuàng)建一個腳本.py
進行腳本編輯拼缝,基本上也是和.R
的創(chuàng)建過程一樣娱局。所以原則應(yīng)該也是差不多的,每個任務(wù)創(chuàng)建一個目錄然后所有的東西都放在一起好管理咧七。
認識Python包
常用的來處理生物信息學(xué)的包比較少衰齐,不像R的bioconductor那么好有獨立的管理工具。
但是目前前輩們已經(jīng)總結(jié)了一些好用的包:
強烈建議參考簡書作者白墨石的推送:【如何快速自學(xué)生物信息學(xué)】
Biopython 包
一般生信分析腳本的工具集继阻。包括核酸序列處理耻涛,NCBI,UniProt數(shù)據(jù)庫操作等其他常用的生信工具瘟檩。
中文教程:https://biopython-cn.readthedocs.io/zh_CN/latest
英文教程:http://biopython.org/DIST/docs/tutorial/Tutorial.html
GitHub:https://github.com/biopython/biopython
pandas 包
用于分析結(jié)構(gòu)化數(shù)據(jù)的python包抹缕,包括對數(shù)據(jù)去空值,統(tǒng)計值計算墨辛,添加卓研,刪除,插入,修改奏赘,提取等等操作寥闪。由于底層基于C,所以可以處理大型文件而且具有很快的分析速度磨淌。
英文教程:https://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html
Matlibplot 包
其實就是在python環(huán)境中的MATLAB (科學(xué)制圖里大神級的軟件)疲憋,而且和它語法結(jié)構(gòu)和用法大致相同。
相當(dāng)于R里面的ggplot2伦糯,只是一個運行與R環(huán)境一個是Python環(huán)境里的可視化工具包柜某,這兩款看個人喜好來學(xué)習(xí)一個,另一個了解就好敛纲。
英文教程:https://matplotlib.org/
作者:白墨石
鏈接:http://www.reibang.com/p/367b2a14f046
他的推送里面除了這個還有很多其他有用的資料喂击。
我學(xué)習(xí)Python的目的只是為了能讀懂代碼,聽說掌握了規(guī)律淤翔,基本上就能讀懂翰绊。這點比較吸引我,我自己是不會去做編程的旁壮。但是要用到這個工具首先得認識监嗜,知道怎么用。所有學(xué)習(xí)說明書還是很有幫助的抡谐。
下面是白先生的Python生信分析系列先收藏了裁奇,方便后面學(xué)習(xí)。
生物信息中的Python 01 | 從零開始處理基因序列
生物信息中的Python 02 | 用biopython解析序列
生物信息中的Python 03 | 自動化操作NCBI
生物信息中的Python 04 | 批量下載基因與文獻
然后還有菜鳥團的作者 大土豆力 的精彩推送:
十分鐘入門潘大師(Pandas)
圖解NumPy包一文就夠了
NumPy正確食用指南
千萬千萬不要犯松鼠癥麦撵,一個勁的收藏都不看9舫Α!C馕浮音五!