基因豐度估計(jì)-salmon
- salmon是常用的轉(zhuǎn)錄組定量軟件之一精钮,也可以用于宏基因組測(cè)序數(shù)據(jù)基因定量攻泼。
- 通過將測(cè)序數(shù)據(jù)比對(duì)回基因胖秒,可以對(duì)每條基因的豐度進(jìn)行估計(jì)雷厂。
- 該軟件可以直接輸入reads進(jìn)行分析凤藏,而不需要提前進(jìn)行比對(duì)奸忽,最終輸出每條基因的reads count計(jì)數(shù)及標(biāo)準(zhǔn)化后的TPM(Transcripts Per Million)
參考腳本
以 unigene 作為 reference 進(jìn)行基因豐度估計(jì)
# 構(gòu)建salmon index用于比對(duì)
salmon index \
-t unigene_cds.fasta \ # 輸入unigene序列文件
-i unigene_index # 輸出index目錄名稱
# 每個(gè)樣品分別定量
salmon quant \
--validateMappings \ # 啟用選擇比對(duì)堕伪,提高靈敏度和特異性
--meta \ # 啟用宏基因組模式
-p 8 \ # 線程
-l IU \ # 文庫類型I表示inward , U表示unstranded
-i unigene_index \ # index目錄
-1 ./A1_1.fq.gz \ # 輸入fq1
-2 ./A1_2.fq.gz \ # 輸入fq2
-o S/A1.quant # 輸出目錄名稱
# 合并生成TPM文件
salmon quantmerge \
--quants 上一步結(jié)果文件 \
--names 樣品順序 \
--column tpm \
-o unigenens.tpm
# 生成count文件
salmon quantmerge \
--quants 同上 \
--names 同上 \
--column numreads \
-o unigenens.count
豐度結(jié)果繪圖
Rscript abundance.R \
unigenens.tpm \ # tmp表格
./sample.txt \ # 樣品分組信息文件
abc # 輸出圖片前綴
結(jié)果文件
abc.boxplot.pdf 箱線圖
abc.cor-cluster.pdf 相關(guān)性熱圖
abc.cor.pdf 相關(guān)性熱圖
abc.density.pdf 密度圖
abc.pca.pdf pca圖