分析內容如下圖所示:
宏基因組分析
具體分析步驟如下:
- 數(shù)據質控侧巨,使用 kneaddata 軟件认罩, 該軟件先調用 Trimmomatic 過濾數(shù)據,然后利用 bowtie2 或 bmtagger 比對宿主數(shù)據庫去除宿主數(shù)據 (也可以去除核糖體數(shù)據)。
- 基因組組裝澎胡,推薦使用 megahit 和 metaspades 軟件按照樣本進行宏基因組組裝,第一個軟件快娩鹉,第二個軟件組裝質量更好攻谁,但是更加耗時。
- 基因預測弯予,使用metagenemark軟件直接從組裝好的 contig 或者 scafford 預測基因戚宦,并使用cd-hit構建非冗余基因集。
- 基因功能預測锈嫩,針對非冗余基因集受楼,利用blast等軟件比對 NR, COG, GO, KEGG, CAZY, ARDB 等數(shù)據庫注釋基因的功能。
- 基因豐度分析呼寸,有兩種方案艳汽,第一種非比對方案,使用 Salmon 軟件对雪;第二種比對方案河狐,bwa或其他比對軟件比對,bedtools豐度統(tǒng)計。
- 功能豐度分析澳眷,結合基因豐度和基因功能注釋進行功能分析拴疤;也可以使用 HUMAnN2 軟件基于 reads 直接進行功能組成定量碍讨。
- 物種豐度分析,使用軟件 MetaPhlAn2 或 Kraken2 實現(xiàn)序列的物種分類碱鳞。
- 差異統(tǒng)計分析,得到物種/基因/功能表后利用R語言或者STAMP等軟件在物種雏赦,基因劫笙,功能等三個層面進行差異分析。