建了個(gè)專(zhuān)門(mén)存放軟件的文件夾,/home/zenglab/biosoft/
查看軟件安裝位置:whereis hisat2
一诀豁、FastQC
1.下載安裝
需要java環(huán)境,先用java -version查看一下是否有java
沒(méi)有則在官網(wǎng)下載一個(gè)64位Linux系統(tǒng)的tar文件
在/usr下建立一個(gè)java文件夾窥妇,sudo mkdir java
將下載的tar文件拷貝到該目錄下舷胜,tar -ZXVf解壓;安裝完畢為他建立一個(gè)鏈接以節(jié)省目錄長(zhǎng)度ln -s /usr/java/jdk1.8.0/ /usr/jdk
配置環(huán)境活翩,在~/.bashrc中寫(xiě)入export PATH=/usr/jdk/bin:$PATH烹骨,sourc一下,輸入java --version得知安裝為20.0.1版本的java
java弄好了材泄,開(kāi)始安裝fastqc(未進(jìn)行環(huán)境配置沮焕!也可使用)
sudo apt-get install fastqc
fastqc [-o output dir] [--(no)extract] [-f fastq|bam|sam] [-c contaminant file] seqfile1 .. seqfileN
nohup fastqc -o ./fastqc_70/ -t 6? /fastq clean/*.fq.gz
輸出結(jié)果每組都有兩個(gè)文件,一個(gè)是html拉宗,一個(gè)是zip文件峦树。
二、multiqc
軟件安裝
conda install -c bioconda multiqc
multiqc /B313/Zjunlin/raw_data/fastqc_70/ -o /B313/Zjunlin/raw_data/multi_qcraw/
三旦事、數(shù)據(jù)過(guò)濾trimmotic
conda install -c bioconda trimmomatic
竟然不需要配置環(huán)境魁巩!
四、下載hisat2
conda install -c bioconda hisat2
下載參考基因組的index文件姐浮,網(wǎng)站地址http://daehwankimlab.github.io/hisat2/download/#m-musculus
下載鼠的UCSC mm10文件
五谷遂、安裝samtools
需安裝特定版本要不然讀不了gz文件
conda install -c bioconda samtools=1.0 --force-reinstall
六、比對(duì)卖鲤,并將輸出文件轉(zhuǎn)換成bam格式
hisat2 -p5 --dta-cufflinks -x /media/zenglab/YQQ/RNAseq/mm10/genome -1?/media/zenglab/ZQ/KCseq/00CleanData/F-AR_1/F-AR_1_.clean.fq.gz?-2 /media/zenglab/ZQ/KCseq/00CleanData/F-AR_1/F-AR_2_.clean.fq.gz --no-unal |samtools view -b > F-AR_1.bam
七肾扰、featurecounts
本次annotation文件使用的是數(shù)據(jù)2/YQQ/RNAseq/MmAnnotation/Mus.GRCm39.109.chr.gtf.gz
featureCounts -T 5 -a 數(shù)據(jù)2/YQQ/RNAseq/MmAnnotation/Mus.GRCm39.109.chr.gtf.gz -o counts.txt?-p -B -C -f -t exon -t exon -g gene_id ./*.bam
做個(gè)小記錄畴嘶,有不對(duì)的地方還請(qǐng)大佬們指出,感謝集晚!