前言
本課程來源于生信技能樹。
本系列課程學(xué)習(xí)的文章是:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commun 2016 Nov 8;7:13347. PMID: 27824034 很容易在文章里面找到數(shù)據(jù)地址GSE81916 這樣就可以下載sra文件作業(yè)透罢,看文章里的methods部分谣光,把它用到的軟件和參數(shù)摘抄下來蔬咬,然后理解GEO/SRA數(shù)據(jù)庫的數(shù)據(jù)存放形式隔嫡,把規(guī)律和筆記發(fā)在論壇上面式塌!
文獻(xiàn)解析
mRNA-Seq
測(cè)序類型:PE 51bp
比對(duì)工具:TopHat (v2.0.13) 參考基因組:hg19
read統(tǒng)計(jì):HTSeq (v0.6.0) 差異基因分析:DESeq (v3.0)
差異外顯子:DEXSeq (v3.1)
others:BEDTools (v2.17.0)劝术、bedGraphToBigWig tool (v4)
RIP-Seq
Peak calling: MACS (v1.4.2 20120305) Motif finding: HOMER (v3.12, 6-8-2012)
others:bedGraphToBigWig缩多、ngs.plot (v2.47)
通過查詢GEO數(shù)據(jù)庫,GSE81916包括人和小鼠的數(shù)據(jù)养晋,本次只下載小鼠數(shù)據(jù)作為練習(xí)衬吆。
數(shù)據(jù)下載
通過ftp鏈接,找到最后4個(gè)小鼠的數(shù)據(jù),用校園網(wǎng)直接通過瀏覽器下載绳泉。也可以wget循環(huán)下載
for((i=59; i<63; i++)); do wget ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747SRR35899$i/SRR35899$i.sra; done
逊抡。
PS: 推薦使用Aspera下載:
wget http://download.asperasoft.com/download/sw/connect/3.7.4/aspera-connect-3.7.4.147727-linux-64.tar.gz
tar zvxf aspera-connect-3.7.4.147727-linux-64.tar.gz
./aspera-connect-3.7.4.147727-linux-64.sh
echo 'PATH=$PATH:~/.aspera/connect/bin/' >> ~/.profile
source ~/.profile
for((i=59; i<63; i++)); do ascp -k 1 -T -l 800M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747SRR35899$i/SRR35899$i.sra . ; done
# EBI中arrayexpress的數(shù)據(jù)下載
ascp -QT -l 800M -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/ERR032/ERR032203/. .