由于需要做微生物的De novo無(wú)參組裝志鹃,查了一些資料發(fā)現(xiàn)大多軟件需要先確定K值肠槽,而kmergenie能夠根據(jù)數(shù)據(jù)的得到最佳的K值悍缠,下邊記錄一下安裝過(guò)程
依賴(lài):
python >= 2.7?
R (r-base) (如果沒(méi)有直接使用 conda install r-base 進(jìn)行安裝)
1雁乡、使用conda安裝(失敗)
conda 是生物信息學(xué)學(xué)習(xí)的必須要掌握的軟件=滞>氩住!
首先在anaconda 中查到kmergenie它匕,搜索結(jié)果如下:
然后使用命令:
conda install?kmergenie? ?進(jìn)行安裝
安裝后使用時(shí)發(fā)現(xiàn)出現(xiàn)錯(cuò)誤:
ModuleNotFoundError: No module named 'readfq'
然后我繼續(xù)用conda安裝readfq:
conda install readfq
仍然沒(méi)有解決這個(gè)問(wèn)題展融,查找了資料說(shuō)是要把readfq的依賴(lài)放到kmergenie中:
kmergenie missing readfq · Issue #37856 · bioconda/bioconda-recipes · GitHub
果斷放棄,選擇自己安裝:
2豫柬、編譯安裝
首先從官網(wǎng)(KmerGenie)下載安裝包告希,安裝步驟如下:
tar -xzvf?kmergenie-1.7051.tar.gz
cd?kmergenie-1.7051/
make
python setup.py install --user? (--user 沒(méi)有管理員權(quán)限的用戶要加上,不然會(huì)報(bào)錯(cuò))
完成后執(zhí)行命令試下: kergenie -h
這就安裝成功了烧给。下邊將其添加進(jìn)環(huán)境變量就行了燕偶,一般我是更改.bashrc 文件在最后一行添加下邊內(nèi)容:
export PATH=$PATH:/public2/home/Software/kmergenie-1.7051
然后 source .bashrc 就ok啦!
3础嫡、使用
kergenie? sequence.txt? -o? kergenie_output/sample? -k 140 -l 15 -s 10 -t 10
sequence.txt 為分析文件(fastq)的絕對(duì)路徑指么,多個(gè)文件要換行
-k 為選擇分析最大的K值
-l 為選擇分析最小的K值
-s 最小值到最大值的步長(zhǎng)
-t 線程數(shù)
注意:第一次分析是s可以設(shè)大點(diǎn),可以根據(jù)分析結(jié)果給出的最佳K值再縮小再進(jìn)一步的分析(第一次:I:15,k:140,s:10? 第二次I:15,k:80,s:6)