宏基因組之基因豐度計算

目前有兩種方式可計算宏基因組基因的豐度昆婿,一種是基于比對生宛,比如bwa,bowtie,soapaligner等主流的比對軟件,另一種是不比對快速估計基因豐度,可以用近倆年來流行的salmon軟件馁痴,這個軟件在轉錄組的數(shù)據(jù)比對中也經(jīng)常用到,可以直接計算出原始的Counts值和標準化的TPM值订雾,此外由于是基于非比對晴玖,計算的速度得到很大的提升,同時也節(jié)省了部分的內(nèi)存(少了龐大的sam/bam文件)谨娜,可以說是多快好省航攒,但是目前的高分文章中也還是不少用基于比對的方法去計算宏基因組的基因豐度的,尤其是Soapaligner比對軟件趴梢,是由華大公司開發(fā)的Soap系列的工具漠畜,首先在速度上具有較大的優(yōu)勢,同時也很好的解決了在小內(nèi)存情況下將短序列比對到參考基因組上的問題坞靶,作用也不容小覷憔狞。當然也有不少研究人員在前期質(zhì)控環(huán)節(jié)進行去宿主也是不錯的選擇~下面我就分別簡單介紹一下基于比對的soapaligner和不比對快速估計的samlon倆個軟件的操作流程!彰阴!

Option1 SOAPaligenr

圖片.png

安裝與比對


1. 安裝  
conda install soap
2. 構建索引  
2bwt-builder contig.fa 
會產(chǎn)生13個索引文件
3.雙端序列進行比對  
soap -p 6 -r 2 -m 200 -x 400 -M 4 -a ./cleandata/B1.clean.fq1.gz -b ./sample1/B1.clean.fq2.gz -D contig.index -o B1_PE.soap -2 B1_SE.soap -u B1_UN.fasta

這個軟件的參數(shù)有點多瘾敢,-a,-b分別輸入雙端序列, -D 索引文件的地址,-o,輸出能比對上組裝后的參考序列且reads成對存在的比對文件尿这,-2簇抵,能比對上組裝后的參考序列但reads不成對存在的比對文件;-u射众,不能比對上組裝后的參考序列碟摆。至于-m,-x參數(shù)比較主觀,看過很多文獻都有不同的設定责球,這里貼出一篇文獻供參考(DOI:10.3389/fmicb.2017.01546),文獻中的參數(shù)為?m 4 ?r 2 ?m 100 ?x 1000=孤摹!

標準化

看過十幾篇文獻在基因豐度標準化這一塊都引用到了一篇2012年發(fā)表在Nature上的一篇文獻(qin2012,doi:10.1038/nature11450),看過之后在該文章的補充材料里發(fā)現(xiàn)了計算基因豐度的步驟雏逾,如下圖倆步驟嘉裤,看過之后感覺其實和轉錄組中的RPKM/TPM等標準化的思路較為類似,先標準化基因的長度栖博,然后再除以標準化的值的總和屑宠。還是挺簡單的嘛。


圖片.png

我們也按照這個思路根據(jù)soapaligner比對的結果來進行標準化,在結果文件中我們能得到三個文件仇让,分別為:B1_PE.soap:能比對上組裝后的參考序列且reads成對存在的比對文件典奉;B1_SE.soap: 能比對上組裝后的參考序列但reads不成對存在的比對文件躺翻;sample1_UN.fasta:不能比對上組裝后的參考序列,通常為fasta格式卫玖;我們只需要比對上的文件B1_PE.soap和B1_SE.soap即可公你。這兩個文件的第8列中比對上的基因,我們將其取出來sort|uniq -c 就可以計算出基因的原始copy數(shù)目假瞬,也就是比對上特定基因的數(shù)目陕靠。之后再計算出比對基因的長度,也就是你組裝去冗余之后的非冗余基因集的各基因長度脱茉,這步可以寫個小腳本或者用現(xiàn)成的輪子seqkit/seqtk都可以很快的解決剪芥,最后利用上面的公式進行標準化就行了~ 還需要注意的一點,沒有比對上的基因我們就用0代替他的原始豐度就好了琴许。

Option2 Samlon

這種方法就更加簡單了税肪,也是大致兩步走,建立索引榜田,序列比對益兄,只不過時間將大大縮短,這種方法網(wǎng)上的教程有很多串慰,我這里貼出我的代碼大家可以比較一下使用~ 建議大家使用時候都安裝最新版本的軟件偏塞,github地址為:https://github.com/COMBINE-lab/salmon/releases/

#1.建立索引
salmon index -t B1_NR100nl.fasta -p 9 -k 31 -i ./index
#2.比對
salmon quant --validateMappings -i ./index -l A -p 3  --meta -1 ../clean1_$.fastq -2 ../clean2_$邦鲫.fastq -o $.quant #基因定量

注意的就是宏基因組數(shù)據(jù)加上-p meta這個參數(shù)神汹,其他參數(shù)默認就好~庆捺,得到的結果有個quant.sf文件,豐度信息就在里面屁魏。為5列的信息,第4列就是我們想要的標準化后的基因豐度了

圖片.png

OK滔以,拿到基因豐度文件之后,我們就可以用來進行后續(xù)分析氓拼,比如計算eggnog數(shù)據(jù)庫比對后的功能基因豐度~這個留到下次再說吧D慊!

下面是剛創(chuàng)建個人公眾號桃漾,會定時更新R坏匪、linux、python撬统,組學方面的學習內(nèi)容适滓,請多多支持呦~~


image
最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市恋追,隨后出現(xiàn)的幾起案子凭迹,更是在濱河造成了極大的恐慌罚屋,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件嗅绸,死亡現(xiàn)場離奇詭異脾猛,居然都是意外死亡,警方通過查閱死者的電腦和手機鱼鸠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進店門尖滚,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人瞧柔,你說我怎么就攤上這事漆弄。” “怎么了造锅?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵撼唾,是天一觀的道長。 經(jīng)常有香客問我哥蔚,道長倒谷,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任糙箍,我火速辦了婚禮渤愁,結果婚禮上,老公的妹妹穿的比我還像新娘深夯。我一直安慰自己抖格,他們只是感情好,可當我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布咕晋。 她就那樣靜靜地躺著雹拄,像睡著了一般。 火紅的嫁衣襯著肌膚如雪掌呜。 梳的紋絲不亂的頭發(fā)上滓玖,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天,我揣著相機與錄音质蕉,去河邊找鬼势篡。 笑死,一個胖子當著我的面吹牛模暗,可吹牛的內(nèi)容都是我干的禁悠。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼汰蓉,長吁一口氣:“原來是場噩夢啊……” “哼绷蹲!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤祝钢,失蹤者是張志新(化名)和其女友劉穎比规,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體拦英,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡蜒什,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了疤估。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片灾常。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖铃拇,靈堂內(nèi)的尸體忽然破棺而出钞瀑,到底是詐尸還是另有隱情,我是刑警寧澤慷荔,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布雕什,位于F島的核電站,受9級特大地震影響显晶,放射性物質(zhì)發(fā)生泄漏贷岸。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一磷雇、第九天 我趴在偏房一處隱蔽的房頂上張望偿警。 院中可真熱鬧,春花似錦唯笙、人聲如沸螟蒸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽尿庐。三九已至,卻和暖如春呢堰,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背凡泣。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工枉疼, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人鞋拟。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓骂维,卻偏偏與公主長得像,于是被迫代替她去往敵國和親贺纲。 傳聞我的和親對象是個殘疾皇子航闺,可洞房花燭夜當晚...
    茶點故事閱讀 44,577評論 2 353