作業(yè)要求
本系列課程學(xué)習(xí)的文章是:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commun 2016 Nov 8;7:13347. PMID: 27824034 很容易在文章里面找到數(shù)據(jù)地址GSE81916 這樣就可以下載sra文件作業(yè)彪见,看文章里的methods部分,把它用到的軟件和參數(shù)摘抄下來讥珍,然后理解GEO/SRA數(shù)據(jù)庫的數(shù)據(jù)存放形式抖苦,把規(guī)律和筆記發(fā)在論壇上面毁菱!
來源于生信技能樹:http://www.biotrainee.com/forum.php?mod=viewthread&tid=1750#lastpost
實(shí)驗(yàn)過程
1.文獻(xiàn)下載
一般我都會(huì)去Google鏡像搜索:https://xueshu.glgoo.net/.此外還會(huì)在SCI-HUB下載米死,不過前段時(shí)間被起訴了,還罰款贮庞,不知道這個(gè)牛逼的網(wǎng)站能夠撐到什么時(shí)候峦筒。在實(shí)驗(yàn)方法的部分GSE81916存放了測(cè)序數(shù)據(jù)。
2.數(shù)據(jù)下載
進(jìn)入NCBI的GEO數(shù)據(jù)庫https://www.ncbi.nlm.nih.gov/geo/窗慎,搜索GSE81916物喷。
看到頁面中的overall design:
所以我們只需要下載樣本9-15數(shù)據(jù)。
數(shù)據(jù)儲(chǔ)存的鏈接:
通過ftp的方式下載數(shù)據(jù)遮斥,其中還介紹了測(cè)序平臺(tái)峦失。
點(diǎn)擊進(jìn)入ftp,看到儲(chǔ)存的所有測(cè)序文件:
下面我們只要執(zhí)行一個(gè)循環(huán)术吗,可以自動(dòng)下載SRR3589956-SRR3589962一共七個(gè)數(shù)據(jù)尉辑,命令如下:
# 我是將數(shù)據(jù)放在disk2/sra目錄下
$ cd ~/disk2 && mkdir sra
$ for ((i=56;i<=62;i++));do wget ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByStudy/sra/SRP/SRP075/SRP075747/SRR35899$i/SRR35899$i.sra ;done
# 只需等待,我當(dāng)時(shí)就是花了一個(gè)晚上的時(shí)間较屿,當(dāng)然這里可以使用sratoolkit自帶的‘prefetch accession’的形式來下載數(shù)據(jù)隧魄,并且默認(rèn)下載到~/ncbi/public/sra 。
3.文章使用的軟件工具
read 計(jì)數(shù):HTSeq
差異基因表達(dá)分析:DESeq
差異外顯子表達(dá)分析:DEXSeq
統(tǒng)計(jì)分析:R
基因富集分析:DAVID