宏基因組學(xué)習(xí)記錄-質(zhì)控組裝

最近在摸索著學(xué)習(xí)宏基因組的數(shù)據(jù)分析摩钙,記錄一下,方便以后看说墨,哪里有錯誤希望看到的人可以指出來,如果有幸?guī)偷搅四悴园兀覍荛_心尼斧。
第二篇:宏基因組學(xué)習(xí)記錄-基因預(yù)測
一、質(zhì)控

  1. 原始數(shù)據(jù)質(zhì)量信息
    這次用的fastqc试吁,當(dāng)然還有其他軟件突颊,比如fastp進(jìn)行質(zhì)控,還可以生成報告潘悼,也很方便
# conda 無腦安裝
conda install -c bioconda fastqc
# fastqc
fastqc -t 10 -o fastqc sample1_1.fq sample1_2.fq ...
  1. 數(shù)據(jù)質(zhì)控
# 下載直接解壓使用,網(wǎng)頁:http://www.usadellab.org/cms/?page=trimmomatic
wetget http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.39.zip

# 解壓
unzip Trimmomatic-0.39.zip 
# 質(zhì)控 shell寫的小循環(huán)
ls raw_data/*fq.gz | while read id
do
echo $id
java -jar /softs_path/Trimmomatic-0.39/trimmomatic-0.39.jar PE -threads 10 ${id%%.*}.R1.fq.gz ${id%%.*}.R2.fq.gz ${id%%.*}.R1.trim.fq ${id%%.*}.R1.unpaired.fq ${id%%.*}.R2.trim.fq ${id%%.*}.R2.unpaired.fq ILLUMINACLIP:~/softs/Trimmomatic-0.39/adapters/TruSeq2-PE.fa:2:30:10 LEADING:10 TRAILING:10 SLIDINGWINDOW:4:20 MINLEN:70;done

3.去宿主

# 下載人基因組文件eg:hg38
wget ftp://ftp.ensembl.org/pub/release-101/fasta/homo_sapiens/dna/Homo_sapiens.GRCh38.dna_rm.primary_assembly.fa.gz
# conda 無腦安裝 bowtie2
conda install -c bioconda bowtie2 
# 構(gòu)建index
bowtie2-build genome.fasta genome
#比對去宿主
ls *trim.fq | while read id
do
echo $id 
bowtie2 -p 10 -x /index_path/genome -1 ${id%%.*}.R1.trim.fq  -2 ${id%%.*}.R2.trim.fq  -S ${id%%.*}.sam 2> ${id%%.*}.bowtie2.log --un-conc-gz ${id%%.*} ;done
# 生成文件sample.1 ,sample.2是去除宿主的序列,重命名
mv sample.1 sample.R1.fq.gz
mv sample.2 sample.R2.fq.gz

最后可以用fastqc看一下clean_reads質(zhì)量情況

二爬橡、組裝
組裝軟件很多,網(wǎng)上也有很多大神總結(jié)的各種軟件的優(yōu)缺點(diǎn)治唤,自行查閱,各取所需
我暫時選擇了megahit這個軟件糙申,資源消耗較少宾添,速度較快,準(zhǔn)確性也滿足基本需求了柜裸。

  1. 軟件安裝
#當(dāng)然是選擇conda了
conda install -c bioconda megahit 
# 查看軟件使用方法
megahit -h

2.合并數(shù)據(jù)
可以分開單組組裝缕陕,也可以合并組裝,此次選擇合并組裝

cat *_R1.fq.gz   >  all_reads_R1.fq.gz
cat  *_R2.fq.gz  >  all_reads_R2.fq.gz

3.組裝

megahit  -1 all_reads_R1.fq.gz -2 all_reads_R2.fq.gz -o assembly/  --out-prefix assembly -t 10 --min-contig-len 300
#簡單介紹一下參數(shù)
-1: R1 reads
-2: R2 reads
-o: 結(jié)果目錄
--out-prefix: 輸出結(jié)果前綴
-t: 線程數(shù)
--min-contig-len: 最小組裝長度

4.組裝質(zhì)量評估

#下載疙挺,解壓扛邑,安裝
wget https://nchc.dl.sourceforge.net/project/quast/quast-5.0.2.tar.gz
tar -xzf quast-5.0.2.tar.gz
cd quast-5.0.2/
python setup.py install_full
#conda 安裝 
conda install -c bioconda quast
quast.py assembly.contigs.fasta -o quast

碼字不易,轉(zhuǎn)載請注明出處铐然,謝謝~

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末蔬崩,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子搀暑,更是在濱河造成了極大的恐慌沥阳,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,539評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件自点,死亡現(xiàn)場離奇詭異桐罕,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,594評論 3 396
  • 文/潘曉璐 我一進(jìn)店門功炮,熙熙樓的掌柜王于貴愁眉苦臉地迎上來溅潜,“玉大人,你說我怎么就攤上這事死宣∥岸瘢” “怎么了?”我有些...
    開封第一講書人閱讀 165,871評論 0 356
  • 文/不壞的土叔 我叫張陵毅该,是天一觀的道長博秫。 經(jīng)常有香客問我,道長眶掌,這世上最難降的妖魔是什么挡育? 我笑而不...
    開封第一講書人閱讀 58,963評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮朴爬,結(jié)果婚禮上即寒,老公的妹妹穿的比我還像新娘。我一直安慰自己召噩,他們只是感情好母赵,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,984評論 6 393
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著具滴,像睡著了一般凹嘲。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上构韵,一...
    開封第一講書人閱讀 51,763評論 1 307
  • 那天周蹭,我揣著相機(jī)與錄音,去河邊找鬼疲恢。 笑死凶朗,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的显拳。 我是一名探鬼主播棚愤,決...
    沈念sama閱讀 40,468評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼杂数!你這毒婦竟也來了遇八?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤耍休,失蹤者是張志新(化名)和其女友劉穎刃永,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體羊精,經(jīng)...
    沈念sama閱讀 45,850評論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡斯够,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,002評論 3 338
  • 正文 我和宋清朗相戀三年囚玫,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片读规。...
    茶點(diǎn)故事閱讀 40,144評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡抓督,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出束亏,到底是詐尸還是另有隱情铃在,我是刑警寧澤,帶...
    沈念sama閱讀 35,823評論 5 346
  • 正文 年R本政府宣布碍遍,位于F島的核電站定铜,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏怕敬。R本人自食惡果不足惜揣炕,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,483評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望东跪。 院中可真熱鬧畸陡,春花似錦、人聲如沸虽填。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,026評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽斋日。三九已至牲览,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間桑驱,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,150評論 1 272
  • 我被黑心中介騙來泰國打工跛蛋, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留熬的,地道東北人。 一個月前我還...
    沈念sama閱讀 48,415評論 3 373
  • 正文 我出身青樓赊级,卻偏偏與公主長得像押框,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子理逊,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,092評論 2 355