今天找計(jì)算測(cè)序覆蓋度的時(shí)候發(fā)現(xiàn)了這個(gè)工具荐捻,github 主頁是https://github.com/bioconvert/bioconvert;幫助文檔的鏈接是 https://bioconvert.readthedocs.io/en/master/
關(guān)于各種各樣的文件格式 可以參考下圖
看幫助文檔的時(shí)候還發(fā)現(xiàn)他可以直接下載測(cè)序數(shù)據(jù)
下面我們嘗試一下
內(nèi)容主要來自 https://bioconvert.readthedocs.io/en/master/tutorial.html
首先是安裝
使用conda 先新建一個(gè)虛擬環(huán)境
conda create -n bioconvert
啟動(dòng)環(huán)境
conda activate bioconvert
安裝
conda install python==3.6
pip install bioconvert
這里遇到了報(bào)錯(cuò),忘記截圖了,我是把pandas安裝了一下
conda install pandas
然后運(yùn)行pip命令
pip install bioconvert==0.4.3 -i https://pypi.tuna.tsinghua.edu.cn/simple
這邊應(yīng)該是安裝成功了
查看幫助文檔bioconvert --help
報(bào)錯(cuò)
查了一下是python版本需要大于3.6潮孽,我剛好安裝的是3.6
重新安裝一下python
將整個(gè)虛擬環(huán)境刪除然后重新安裝
conda remove -n bioconvert --all
重新安裝
conda create -n bioconvert python=3.7
conda activate bioconvert
pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install bioconvert==0.4.3 -i https://pypi.tuna.tsinghua.edu.cn/simple
這下沒有報(bào)錯(cuò)顶燕,但是遇到了很多警告信息,暫時(shí)不管了
試一下烦感,NCBI下載了一個(gè)genbank文件逝变,線板fasta格式的序列提取出來 https://www.ncbi.nlm.nih.gov/nuccore/FN433596
bioconvert genbank2fasta staphylococcus_aureus.gb
使用命令的時(shí)候會(huì)跳出來很多警告信息
接下來又嘗試了 from sources 的安裝方法
這套命令運(yùn)行下來 依然有一個(gè)警告信息基茵,但是比之前少了很多
幫助文檔里還提到了使用conda直接安裝,但是我這邊就一直沒有成功壳影,暫時(shí)不知道什么原因
最后再試一下gb文件中提取fasta文件
bioconvert genbank2fasta sequence.gb output.fasta
這次成功了 輸出的HHH是哈哈哈哈的意思嗎 哈哈哈哈
歡迎大家關(guān)注我的公眾號(hào)
小明的數(shù)據(jù)分析筆記本
小明的數(shù)據(jù)分析筆記本 公眾號(hào) 主要分享:1拱层、R語言和python做數(shù)據(jù)分析和數(shù)據(jù)可視化的簡(jiǎn)單小例子;2宴咧、園藝植物相關(guān)轉(zhuǎn)錄組學(xué)根灯、基因組學(xué)、群體遺傳學(xué)文獻(xiàn)閱讀筆記掺栅;3烙肺、生物信息學(xué)入門學(xué)習(xí)資料及自己的學(xué)習(xí)筆記!