kraken軟件操作手冊(cè)

轉(zhuǎn)錄組數(shù)據(jù)質(zhì)量分析完,想拿kraken軟件分析下數(shù)據(jù)有沒有微生物的序列污染

找了全網(wǎng)沒看見什么相關(guān)的指導(dǎo)文章佃却,看官網(wǎng)的操作手冊(cè)也很雞助哟沫,所以自己翻譯了官網(wǎng)手冊(cè)以及寫了代碼公荧,希望對(duì)后來的人有些幫助。

Kraken是2013年Wood提出的的宏基因組序列分類軟件携冤,能夠快速對(duì)宏基因樣品中的DNA序列進(jìn)行分類盒刚,因此可以進(jìn)行微生物檢測(cè)细诸。Kraken在序列比對(duì)環(huán)節(jié)(環(huán)節(jié)C)采用精確k-mer匹配和精簡(jiǎn)數(shù)據(jù)庫(kù)的方法(環(huán)節(jié)B)惕它,忽略基因變異怕午,采取精確匹配;并且建立了專用數(shù)據(jù)庫(kù)與k-mer匹配相配合淹魄,極大地提高了檢測(cè)速度.Kraken分為兩個(gè)版本:內(nèi)存開銷較大的normal版和將內(nèi)存開銷限制為2Gb以內(nèi)的mini版.Kraken速度極快郁惜,精度較低,適用于做微生物檢測(cè)的預(yù)處理.

官網(wǎng)網(wǎng)址:http://ccb.jhu.edu/software/kraken/

操作文檔網(wǎng)址 :http://ccb.jhu.edu/software/kraken/MANUAL.html

一 安裝

1甲锡、如果安裝了miniconda的話可以直接用命令安裝

??conda install kraken

2兆蕉、從kraken官網(wǎng)下載source包,其中包括了kraken的一些代碼缤沦,安裝腳本install_kraken.sh虎韵,以及readme文件

在安裝腳本目錄下運(yùn)行

./install_kraken.sh $KRAKEN_DIR

$KRAKEN_DIR指定kraken安裝的目錄

當(dāng)看到提示 "Kraken installation complete."說明安裝完成,隨后將kraken兩個(gè)主要的腳本復(fù)制到加入環(huán)境變量

cp $KRAKEN_DIR/bin/kraken $HOME/bin

cp $KRAKEN_DIR/bin/kraken-build $HOME/bin

$HOME/bin你環(huán)境變量的位置

二缸废、下載kraken標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)

kraken-build --standard --threads 24 --db $DBNAME

--threads 24?指定線程數(shù)24

--db $DBNAME?指定安裝的目錄

當(dāng)數(shù)據(jù)庫(kù)構(gòu)建完成包蓝,可以使用以下命令刪除冗余的文件

kraken-build --db $DBNAME --clean

三、分類代碼

kraken --db $DBNAME seqs.fa

主要參數(shù):

--threads NUM?設(shè)置線程數(shù)

--classified-out?輸出已經(jīng)被分類的序列也就是污染的序列

--unclassified-out?輸出未被分類的序列也就是未污染的序列

--output?輸出

| or >?也是輸出

--fastq-input?聲明輸入文件是fastq格式

--gzip-compressed?聲明輸入文件是.gz的壓縮格式

--bzip2-compressed?聲明輸入文件是.bz的壓縮格式

--paired?如果是雙端測(cè)序呆奕,則需聲明為是雙端測(cè)序

四养晋、實(shí)例代碼

代碼一:輸出classify序列和unclassify序列以及一個(gè).kraken文件

--threads?8:指定線程 8

--db?/data/program/Assessment/kraken_database/?指定標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)的路徑

--fastq-input--gzip-compressed?指定fastq文件格式,這里指定為gzip

--paired?指定是雙端測(cè)序

${output_forward_paired}${output_reverse_paired}輸入文件的路徑與名稱:read1 read2

--classified-out?指定輸出分類的序列文件——有污染

${output_classify}?輸出分類的序列文件的路徑及名稱

--unclassified-out?指定輸出未分類的序列文件——無污染

${output_unclassify}輸出未分類的序列文件的路徑及名稱

>?${kraken}?輸出一個(gè).kraken文件

代碼二:輸出報(bào)告梁钾,報(bào)告統(tǒng)計(jì)了污染的比例绳泉,還有污染的種類

${kraken}上面生成的.kraken文件

>?${kraken_report}?指定輸出報(bào)告的路徑及名稱

最終我加入我自己的輸入文件路徑與輸出文件路徑等內(nèi)容,寫成的代碼如下:

nohup...& 是把任務(wù)掛到后臺(tái)運(yùn)行

最終得到的報(bào)告如下:

98.46%未被污染

1.54%被污染姆泻,且列出污染的序列屬于哪個(gè)物種零酪。

就醬

希望對(duì)大家有幫助。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末拇勃,一起剝皮案震驚了整個(gè)濱河市四苇,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌方咆,老刑警劉巖月腋,帶你破解...
    沈念sama閱讀 217,826評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異瓣赂,居然都是意外死亡榆骚,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,968評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門煌集,熙熙樓的掌柜王于貴愁眉苦臉地迎上來妓肢,“玉大人,你說我怎么就攤上這事苫纤〉锬疲” “怎么了纲缓?”我有些...
    開封第一講書人閱讀 164,234評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)喊废。 經(jīng)常有香客問我祝高,道長(zhǎng),這世上最難降的妖魔是什么污筷? 我笑而不...
    開封第一講書人閱讀 58,562評(píng)論 1 293
  • 正文 為了忘掉前任褂策,我火速辦了婚禮,結(jié)果婚禮上颓屑,老公的妹妹穿的比我還像新娘。我一直安慰自己耿焊,他們只是感情好揪惦,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,611評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著罗侯,像睡著了一般器腋。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上钩杰,一...
    開封第一講書人閱讀 51,482評(píng)論 1 302
  • 那天纫塌,我揣著相機(jī)與錄音,去河邊找鬼讲弄。 笑死措左,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的避除。 我是一名探鬼主播怎披,決...
    沈念sama閱讀 40,271評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼瓶摆!你這毒婦竟也來了凉逛?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,166評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤群井,失蹤者是張志新(化名)和其女友劉穎状飞,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體书斜,經(jīng)...
    沈念sama閱讀 45,608評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡诬辈,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,814評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了菩佑。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片自晰。...
    茶點(diǎn)故事閱讀 39,926評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖稍坯,靈堂內(nèi)的尸體忽然破棺而出酬荞,到底是詐尸還是另有隱情搓劫,我是刑警寧澤,帶...
    沈念sama閱讀 35,644評(píng)論 5 346
  • 正文 年R本政府宣布混巧,位于F島的核電站枪向,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏咧党。R本人自食惡果不足惜秘蛔,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,249評(píng)論 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望傍衡。 院中可真熱鬧深员,春花似錦、人聲如沸蛙埂。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,866評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)绣的。三九已至叠赐,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間屡江,已是汗流浹背芭概。 一陣腳步聲響...
    開封第一講書人閱讀 32,991評(píng)論 1 269
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留惩嘉,地道東北人罢洲。 一個(gè)月前我還...
    沈念sama閱讀 48,063評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像宏怔,于是被迫代替她去往敵國(guó)和親奏路。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,871評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 第十章 使用序列數(shù)據(jù) 生物信息學(xué)的核心問題之一是處理大量的(通常定義糟糕或模糊)文件格式臊诊。久而久之鸽粉,一些特定的簡(jiǎn)單...
    yangliunk1987閱讀 5,029評(píng)論 3 53
  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn)抓艳,斷路器触机,智...
    卡卡羅2017閱讀 134,656評(píng)論 18 139
  • 官網(wǎng) 中文版本 好的網(wǎng)站 Content-type: text/htmlBASH Section: User ...
    不排版閱讀 4,381評(píng)論 0 5
  • 個(gè)人學(xué)習(xí)批處理的初衷來源于實(shí)際工作;在某個(gè)迭代版本有個(gè)BS(安卓手游模擬器)大需求玷或,從而在測(cè)試過程中就重復(fù)涉及到...
    Luckykailiu閱讀 4,718評(píng)論 0 11
  • 我向來知道: 一些話(姑且稱這些還沒說出口的想法為“話”吧)在腦海里初初形成是一種味道儡首;抓住它的尾巴,細(xì)細(xì)揣摩一番...
    不笑_閱讀 152評(píng)論 0 0