singlem,一款可以使用marker基因進(jìn)行宏基因組reads分類(lèi)的軟件

最近偶然從一篇PNAs的文章,看到作者不僅進(jìn)行了16S rRNA測(cè)序逗柴,而且通過(guò)marker基因和宏基因組bins同時(shí)計(jì)算了群落結(jié)構(gòu)蛹头,對(duì)比三者發(fā)現(xiàn),菌群結(jié)構(gòu)相似戏溺。

看了一下marker基因?qū)昊蚪Mreads進(jìn)行分類(lèi)的方法渣蜗,作者提到了singlem(見(jiàn)下圖)。


于是就想試試singlem好不好用于购,按照作者的說(shuō)法袍睡,為了與宏基因組bins的分類(lèi)盡可能一致,所以要使用GTDB的分類(lèi)標(biāo)準(zhǔn)肋僧。其實(shí)很有道理斑胜,因?yàn)閷?duì)于細(xì)菌來(lái)說(shuō)控淡,GTDB的分類(lèi)和NCBI里面分類(lèi)好多都不一樣。而后作者又提到止潘,他download了所有GTDB的rplp序列掺炭,這個(gè)我是沒(méi)找到從GTDB下載單個(gè)基因的方法, GTDB難道不是只能下載基因組和某個(gè)物種串聯(lián)后的蛋白文件嗎凭戴?

所以就干脆自己翻譯涧狮,自己用hmmsearch找rplp基因。

先說(shuō)singlem的安裝么夫,其實(shí)有不少坑者冤,首先它依賴于GraftM。GraftM用conda安裝的時(shí)候档痪,經(jīng)常會(huì)漏掉一些python的包涉枫,其實(shí)問(wèn)題不大,耐心點(diǎn)用pip一一安裝完畢腐螟。

下面說(shuō)說(shuō)操作步驟

1 ?使用prodigal預(yù)測(cè)GTDB所有基因組

prodigal -i ${j%.gz} -a temp.orfs.faa -d temp.orfs.ffn -m -o temp.txt -p meta

cut -f 1 -d " " temp.orfs.faa >${j%.fna.gz}.faa

cut -f 1 -d " " temp.orfs.ffn >${j%.fna.gz}.ffn

建議寫(xiě)個(gè)shell循環(huán)愿汰,畢竟6萬(wàn)多個(gè)基因組,我這只是貼了腳本的一部分乐纸。

2 pfam下載rplp基因hmm文件衬廷,即Ribosomal_L16.hmm。而后hmmsearch繼續(xù)循環(huán)查找

3 繼續(xù)寫(xiě)個(gè)小shell循環(huán)提取所有的汽绢,能找到的rplp基因序列

grep -v "^#" rplp.out | awk '{print $1}' | seqkit grep -f - ${line%/}.faa > ${line%_genomic/}.rplp

里面還涉及到修改序列名字等吗跋,自行寫(xiě)腳本,此處不表宁昭。

4 合并rplp基因小腊,以及GTDB庫(kù)的taxonomy文件,使用GraftM建庫(kù)

graftM create --output ./my.gpkg --sequences gtdb.rplp.fasta --taxonomy taxonomy.txt

耐心等待完成后久窟,將my.gpkg移動(dòng)到miniconda3/envs/singlem/lib/python3.6/site-packages/singlem/data/

這里還有個(gè)坑,注意json文件本缠,修改成自定義庫(kù)的名字斥扛,否則python找不到。

此時(shí)建庫(kù)完成丹锹,參考singlem說(shuō)明書(shū)稀颁,跑一下試試

singlem pipe --forward 58_clean_1.fq --reverse 58_clean_2.fq --otu_table 2.tsv --threads 20

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市楣黍,隨后出現(xiàn)的幾起案子匾灶,更是在濱河造成了極大的恐慌,老刑警劉巖租漂,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件阶女,死亡現(xiàn)場(chǎng)離奇詭異颊糜,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)秃踩,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)衬鱼,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人憔杨,你說(shuō)我怎么就攤上這事鸟赫。” “怎么了消别?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵抛蚤,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我寻狂,道長(zhǎng)岁经,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任荆虱,我火速辦了婚禮蒿偎,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘怀读。我一直安慰自己诉位,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布菜枷。 她就那樣靜靜地躺著苍糠,像睡著了一般。 火紅的嫁衣襯著肌膚如雪啤誊。 梳的紋絲不亂的頭發(fā)上岳瞭,一...
    開(kāi)封第一講書(shū)人閱讀 48,954評(píng)論 1 283
  • 那天,我揣著相機(jī)與錄音蚊锹,去河邊找鬼瞳筏。 笑死,一個(gè)胖子當(dāng)著我的面吹牛牡昆,可吹牛的內(nèi)容都是我干的姚炕。 我是一名探鬼主播,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼丢烘,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼柱宦!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起播瞳,我...
    開(kāi)封第一講書(shū)人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤掸刊,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后赢乓,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體忧侧,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡石窑,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了苍柏。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片尼斧。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖试吁,靈堂內(nèi)的尸體忽然破棺而出棺棵,到底是詐尸還是另有隱情,我是刑警寧澤熄捍,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布烛恤,位于F島的核電站,受9級(jí)特大地震影響余耽,放射性物質(zhì)發(fā)生泄漏缚柏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一碟贾、第九天 我趴在偏房一處隱蔽的房頂上張望币喧。 院中可真熱鬧,春花似錦袱耽、人聲如沸杀餐。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)史翘。三九已至,卻和暖如春冀续,著一層夾襖步出監(jiān)牢的瞬間琼讽,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工洪唐, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留钻蹬,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓凭需,卻偏偏與公主長(zhǎng)得像脉让,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子功炮,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容