RNA-seq analysis

Download dataset

Navigate to https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE102116

復(fù)制:

image.png

Paste to terminal:

cd yourdir
vim gsm.lst

右擊粘貼:

image.png

保存退出:

:wq

運(yùn)行命令生成SRR文件下載地址列表:

zhoujj 15:55:27 ~/project/06ChenProject/data_GSE102116
$perl /home/zhoujj/github/jjUtil/dl/get_srr_from_gsm.pl gsm.lst > srr.lst

查看生成的列表:

zhoujj 16:00:09 ~/project/06ChenProject/data_GSE102116
$cat srr.lst
GSM2724132      WT_rep1_Day0    SRR5886648
GSM2724133      WT_rep2_Day0    SRR5886652

下載SRR文件:

zhoujj 16:01:24 ~/project/06ChenProject/data_GSE102116
$cut -f 3 srr.lst | while read line; do echo prefetch $line;done > prefetch.sh;
zhoujj 16:01:33 ~/project/06ChenProject/data_GSE102116
$sh prefetch.sh

下載完畢,尋找下載的文件:

zhoujj 16:01:33 ~/project/06ChenProject/data_GSE102116
$ls ~/ncbi/public/sra/
zhoujj 16:01:33 ~/project/06ChenProject/data_GSE102116
$cut -f 3 srr.lst | while read line; do mv  ~/ncbi/public/sra/$line.sra .;done;

完成SRR文件下載周拐。

解壓SRA文件:

zhoujj 16:07:15 ~/project/06ChenProject/data_GSE102116
$ls
GSM2724134.html  gsm.lst  prefetch.sh  SRR6880514.sra  srr.lst  SRX3052556.html  work.sh
zhoujj 16:07:17 ~/project/06ChenProject/data_GSE102116
$fastq-dump --split-files ./SRR6880514.sra
Read 14772104 spots for ./SRR6880514.sra
Written 14772104 spots for ./SRR6880514.sra
$ls
GSM2724134.html  gsm.lst  prefetch.sh  SRR6880514_1.fastq  SRR6880514_2.fastq  SRR6880514.sra  srr.lst  SRX3052556.html  work.sh

SRR6880514_1.fastq is read1
SRR6880514_2.fastq is read2

Run RNA-seq (此處省略)

  1. 前期準(zhǔn)備:
zhoujj 16:10:52 ~/project/06ChenProject/data_GSE102116
$mkdir rnaseq
zhoujj 16:11:18 ~/project/06ChenProject/data_GSE102116
$cd rnaseq/
zhoujj 16:12:32 ~/project/06ChenProject/data_GSE102116/rnaseq
$cp /home/zhoujj/gitee/ngskit/rnaseq_rmdup_star_cufflinks/bin/config.txt .
zhoujj 16:12:58 ~/project/06ChenProject/data_GSE102116/rnaseq
$vim config.txt

check read len:

zhoujj 16:16:30 ~/project/06ChenProject/data_GSE102116/rnaseq
$head ../SRR6880514_2.fastq
@SRR6880514.1 R0209720:515:C7WURACXX:1:1101:2358:2187 length=51
TGGTGAATTTCTCTGATCTAGCATGATAAGTAGAAACATTAAACTGTGATA
+SRR6880514.1 R0209720:515:C7WURACXX:1:1101:2358:2187 length=51
@CCDFFFFHHHHHJJJJJJJJJJJJHIJJJJJJIJJJJJJJJJJJJIIGIG
@SRR6880514.2 R0209720:515:C7WURACXX:1:1101:3400:2240 length=51
TCTCCAGGGCATGTCAGAGATGTTTGCGGCAGCCCCTCCCATCACAGGCCT
+SRR6880514.2 R0209720:515:C7WURACXX:1:1101:3400:2240 length=51
C@CFFFFFFGHDHHIIIGAFCHEEDHI<FHHH1DDFEGFHI<FHIEIIFI<
@SRR6880514.3 R0209720:515:C7WURACXX:1:1101:4539:2113 length=51
TCTTTTTACTTAGGATTGTCTTGGCTATATGGCTCTTTTTTGGTTTCATAT

read len = 51

so check parameters in config.txt

OUTDIR  ./
SAMPLE  ./samples.lst

# parameter
READLEN 51 # check this parameters
MINLEN  32 # check this parameters, >= 32 
THREAD  24

#STANDTYPE      FR/FF/RF/RR
# pro
BIN     /home/zhoujj/gitee/ngskit/rnaseq_rmdup_star_cufflinks/bin/
FASTQC  /home/zhoujj/software/FastQC/fastqc
STAR    /home/zhoujj/software/STAR/bin/Linux_x86_64_static/STAR
CUFFLINKS       /home/zhoujj/software/cufflinks-2.2.1.Linux_x86_64/cufflinks
SAMTOOLS        /usr/bin/samtools
HOMER   /home/zhoujj/software/homer/bin

# for STAR
GTF     /home/zhoujj/data/hg19/hg19/refGene.gtf
SPE     human
INDEX   /home/zhoujj/data/hg19/star_index
CHROMSIZE       /home/zhoujj/data/hg19/hg19.chrom.sizes
  1. Prepare samples.lst
    Find read files:
zhoujj 16:18:22 ~/project/06ChenProject/data_GSE102116/rnaseq
$ll /home/zhoujj/project/06ChenProject/data_GSE102116/SRR6880514_1.fastq
-rw-rw-r-- 1 zhoujj zhoujj 3655968420 Jul 31 16:09 /home/zhoujj/project/06ChenProject/data_GSE102116/SRR6880514_1.fastq
zhoujj 16:18:32 ~/project/06ChenProject/data_GSE102116/rnaseq
$ll /home/zhoujj/project/06ChenProject/data_GSE102116/SRR6880514_2.fastq
-rw-rw-r-- 1 zhoujj zhoujj 3655968420 Jul 31 16:09 /home/zhoujj/project/06ChenProject/data_GSE102116/SRR6880514_2.fastq

samples.lst

WT_rep1_Day0    /home/zhoujj/project/06ChenProject/data_GSE102116/SRR6880514_1.fastq    /home/zhoujj/project/06ChenProject/data_GSE102116/SRR6880514_2.fastq

Recheck files:

zhoujj 16:20:52 ~/project/06ChenProject/data_GSE102116/rnaseq
$ll
total 16
drwxrwxr-x 2 zhoujj zhoujj 4096 Jul 31 16:20 ./
drwxrwxr-x 3 zhoujj zhoujj 4096 Jul 31 16:16 ../
-rw-rw-r-- 1 zhoujj zhoujj  989 Jul 31 16:12 config.txt
-rw-rw-r-- 1 zhoujj zhoujj  151 Jul 31 16:20 samples.lst
  1. Create makefile and run RNA-seq pipeline

Create makefile:

zhoujj 16:20:54 ~/project/06ChenProject/data_GSE102116/rnaseq
$perl /home/zhoujj/gitee/ngskit/rnaseq_rmdup_star_cufflinks/bin/rnaseq.pl config.txt
OUTDIR  ./
SAMPLE  ./samples.lst
READLEN 51
MINLEN  32
THREAD  24
BIN     /home/zhoujj/gitee/ngskit/rnaseq_rmdup_star_cufflinks/bin/
FASTQC  /home/zhoujj/software/FastQC/fastqc
STAR    /home/zhoujj/software/STAR/bin/Linux_x86_64_static/STAR
CUFFLINKS       /home/zhoujj/software/cufflinks-2.2.1.Linux_x86_64/cufflinks
SAMTOOLS        /usr/bin/samtools
HOMER   /home/zhoujj/software/homer/bin
GTF     /home/zhoujj/data/hg19/hg19/refGene.gtf
SPE     human
INDEX   /home/zhoujj/data/hg19/star_index
CHROMSIZE       /home/zhoujj/data/hg19/hg19.chrom.sizes

Run RNA-seq pipeline:

zhoujj 16:23:58 ~/project/06ChenProject/data_GSE102116/rnaseq
$cut -f 1 samples.lst | while read line; do echo "cd $line && make && cd -";done > run.sh;
zhoujj 16:25:29 ~/project/06ChenProject/data_GSE102116/rnaseq
$sh run.sh

檢查結(jié)果

Check statistics:

zhoujj 16:27:02 ~/project/06ChenProject/data_GSE102116/rnaseq
$cat samples.lst
WT_rep1_Day0    /home/zhoujj/project/06ChenProject/data_GSE102116/SRR6880514_1.fastq    /home/zhoujj/project/06ChenProject/data_GSE102116/SRR6880514_2.fastq
zhoujj 16:27:09 ~/project/06ChenProject/data_GSE102116/rnaseq
$perl /home/zhoujj/gitee/ngskit/rnaseq_rmdup_star_cufflinks/bin/getMatrics.pl WT_rep1_Day0 > stat.txt

Combine expression profile from multiple samples:

zhoujj 16:27:09 ~/project/06ChenProject/data_GSE102116/rnaseq
$perl /home/zhoujj/gitee/ngskit/rnaseq_rmdup_star_cufflinks/bin/combine_cuff_expr.py WT_rep1_Day0/02quantification/genes.fpkm_tracking:WT_rep1_Day0 WT_rep1_Day3/02quantification/genes.fpkm_tracking:WT_rep1_Day3 > gene.expr

Finished.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末瘟芝,一起剝皮案震驚了整個(gè)濱河市鲸拥,隨后出現(xiàn)的幾起案子顷啼,更是在濱河造成了極大的恐慌贷掖,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,402評(píng)論 6 499
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件孽糖,死亡現(xiàn)場(chǎng)離奇詭異枯冈,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)办悟,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,377評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門尘奏,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人病蛉,你說(shuō)我怎么就攤上這事炫加。” “怎么了铺然?”我有些...
    開封第一講書人閱讀 162,483評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵俗孝,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我魄健,道長(zhǎng)驹针,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,165評(píng)論 1 292
  • 正文 為了忘掉前任诀艰,我火速辦了婚禮柬甥,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘其垄。我一直安慰自己苛蒲,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,176評(píng)論 6 388
  • 文/花漫 我一把揭開白布绿满。 她就那樣靜靜地躺著臂外,像睡著了一般。 火紅的嫁衣襯著肌膚如雪喇颁。 梳的紋絲不亂的頭發(fā)上漏健,一...
    開封第一講書人閱讀 51,146評(píng)論 1 297
  • 那天溺职,我揣著相機(jī)與錄音匀钧,去河邊找鬼。 笑死软啼,一個(gè)胖子當(dāng)著我的面吹牛姐叁,可吹牛的內(nèi)容都是我干的瓦盛。 我是一名探鬼主播,決...
    沈念sama閱讀 40,032評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼外潜,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼原环!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起处窥,我...
    開封第一講書人閱讀 38,896評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤嘱吗,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后滔驾,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體谒麦,經(jīng)...
    沈念sama閱讀 45,311評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,536評(píng)論 2 332
  • 正文 我和宋清朗相戀三年嵌灰,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了弄匕。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,696評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡沽瞭,死狀恐怖迁匠,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情驹溃,我是刑警寧澤城丧,帶...
    沈念sama閱讀 35,413評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站豌鹤,受9級(jí)特大地震影響亡哄,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜布疙,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,008評(píng)論 3 325
  • 文/蒙蒙 一蚊惯、第九天 我趴在偏房一處隱蔽的房頂上張望愿卸。 院中可真熱鬧,春花似錦截型、人聲如沸趴荸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)发钝。三九已至,卻和暖如春波闹,著一層夾襖步出監(jiān)牢的瞬間酝豪,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,815評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工精堕, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留孵淘,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,698評(píng)論 2 368
  • 正文 我出身青樓锄码,卻偏偏與公主長(zhǎng)得像夺英,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子滋捶,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,592評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • ============= 1. 作者介紹 ============= 這是一個(gè)位于波士頓的癌癥研究中心與英國(guó)牛津...
    Yeyuntian閱讀 3,406評(píng)論 0 21
  • NCBI-SRA和EBI-ENA數(shù)據(jù)庫(kù) SRA數(shù)據(jù)庫(kù): Sequence Read Archive:隸屬NCBI ...
    dulunar閱讀 31,540評(píng)論 6 74
  • 比對(duì)軟件很多痛悯,首先大家去收集一下,因?yàn)槲覀兪菐Т蠹胰腴T重窟,請(qǐng)統(tǒng)一用hisat2(官網(wǎng)https://ccb.jhu....
    Y大寬閱讀 104,649評(píng)論 12 188
  • 許多懂藝術(shù)的人會(huì)看不起不懂藝術(shù)的人载萌,好像不懂藝術(shù)的人就沒有文化一樣, 許多成年人會(huì)看不起少年巡扇,就像少年什么都不懂一...
    JPF_1afc閱讀 204評(píng)論 0 0
  • 人之初扭仁,性本善,長(zhǎng)大以后這句話成了厅翔,人之初乖坠,性本惡!解釋的意思就是人生下來(lái)就是自私刀闷,沒有孔融讓梨的故事熊泵,這是為了教...
    遺落極光閱讀 428評(píng)論 0 0