RNA-seq轉(zhuǎn)錄組數(shù)據(jù)分析2022-09-30

RNA-seq轉(zhuǎn)錄組數(shù)據(jù)分析思路

數(shù)據(jù)產(chǎn)生

-測(cè)序的平臺(tái)和測(cè)序的類型
-測(cè)序基本原理
1.single end 蒋失、2.pair end測(cè)序卸伞、3.mate pair測(cè)序
-實(shí)驗(yàn)設(shè)計(jì)

數(shù)據(jù)處理

-數(shù)據(jù)誤差來(lái)源
-質(zhì)量控制軟件FastQC結(jié)果解讀
-數(shù)據(jù)過(guò)濾軟件Trimmomatic

有參轉(zhuǎn)錄組序列比對(duì)hisat2

-不同軟件的比較
-常用高通量序列比對(duì)算法
-基因組
1.STAR、2.
-轉(zhuǎn)錄本
RSEM

無(wú)參轉(zhuǎn)錄組

-轉(zhuǎn)錄本從頭拼接原理
-拼接方法 Trinity

表達(dá)定量

-RNA-seq常用的統(tǒng)計(jì)定量單位
-基因組比對(duì)
1.Htseq-Count淘太、2.FeatureCount
-轉(zhuǎn)綠本比對(duì)
Rsem

無(wú)比對(duì)快速定量

kallisto
數(shù)據(jù)如何分析

差異表達(dá)

-Deseq標(biāo)準(zhǔn)化原理
-結(jié)果解讀

8.富集分析

-Go常用網(wǎng)站和工具
-通路富集分析

9.數(shù)據(jù)可視化展示

-IGV
-基因?yàn)g覽器

實(shí)戰(zhàn)演練

數(shù)據(jù)預(yù)處理

構(gòu)建目錄

-原始數(shù)據(jù)目錄
-基因組文件
-注釋信息文件
-結(jié)果文件

參考序列下載

-參考基因組fasta
去相關(guān)數(shù)據(jù)庫(kù)下載參考基因組的fasta文件
-注釋信息 gtf、gff
ensembl、jgl等數(shù)據(jù)庫(kù)沦疾,araport數(shù)據(jù)網(wǎng)站

原始數(shù)據(jù)上傳

檢測(cè)數(shù)據(jù)完整性md5值
md5sum *gz>md5.txt
md5sum -c md5.txt #比對(duì)已經(jīng)有點(diǎn)數(shù)據(jù)

質(zhì)量控制

-安裝conda使用fastQC
which fastqc #查找是否有該軟件
fastqc 序列文件名.fastqc.gz 進(jìn)行處理
fastqc *.gz #進(jìn)行多個(gè)處理
或者
for i in ls *gz;do fastqc $i ;done #for循環(huán)實(shí)現(xiàn)批處理
或者(將文件放入后臺(tái)并行處理)
ls *.gz |xargs -I [] echo 'nohup fastqc [] &' >fastqc.sh
bash fastqc.sh

Multiqc進(jìn)行多個(gè)質(zhì)控結(jié)果可視化

multiqc ./ #在當(dāng)前文件下進(jìn)行比對(duì)

質(zhì)量過(guò)濾-Trimmomatic(需要java的環(huán)境)

對(duì)illumina測(cè)序文件的接頭進(jìn)行開(kāi)頭結(jié)尾進(jìn)行切除
接頭的序列信息不同,采用不同的命令進(jìn)行處理
illumina Single End/illumina Paired End : TruSeq2-SE.fa/TruSeq2-PE.fa
TruSeq Universal Adapter/TruSeq Adapter,index: TruSeq3-SE.fa TruSeq3-PE.fa
接頭參數(shù)的選擇
TRUE/FALSE
雙端測(cè)序用TRUE

序列比對(duì)

-無(wú)參分析:轉(zhuǎn)錄本拼接——trinity
-以轉(zhuǎn)錄本和基因組分別進(jìn)行比對(duì)

轉(zhuǎn)錄本

RASE

基因組

-STAR實(shí)例
1.建立索引
STAR --runThreadN 6 --runMode genomeGenerate
--genomeDir arab_STAR_genome(比對(duì)的文件輸出目錄)
--genomeFastaFiles /目錄/文件 (比對(duì)的參考文件)
--sidbGTFfile /目錄/文件 (比對(duì)的注釋文件)
--sidbOverhang 149^C (比對(duì)reads的長(zhǎng)度-1)
2.進(jìn)行比對(duì)

image.png

3.查看比對(duì)文件


image.png

-Hisat2

表達(dá)定量分析

-處理原始比對(duì)文件
picard第队、samtools
將sam文件變成bam文件
-先比對(duì)再定量STAR+RSEM/STAR+HTSeq


image.png

構(gòu)建準(zhǔn)備環(huán)境


image.png

參考基因組轉(zhuǎn)錄本文件
image.png

查看
image.png

主要關(guān)注的是基因和轉(zhuǎn)錄本的信息哮塞。

-非比對(duì)的定量表達(dá)分析Kallisto(free-alignment)
構(gòu)建索引


image.png

定量


image.png

觀察.tsv文件

差異分析

featureCounts+STAR軟件能夠提升表達(dá)定量的速度
conda install subread


image.png

查看文件內(nèi)容

表達(dá)定量結(jié)果轉(zhuǎn)換為表達(dá)矩陣

到RESM的輸出文件目錄操作


image.png

生成基因表達(dá)矩陣
查看之后剔除表達(dá)量為0的命令


image.png

進(jìn)入R之后操作...

-edgeR
-DESeq2

。凳谦。忆畅。。尸执。家凯。。
由于配置環(huán)境未成功如失,后續(xù)操作做不了绊诲。
詳情參見(jiàn)于:
RNA-seq轉(zhuǎn)錄組數(shù)據(jù)分析入門實(shí)戰(zhàn)07-差異分析_嗶哩嗶哩_bilibili

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市褪贵,隨后出現(xiàn)的幾起案子掂之,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件板惑,死亡現(xiàn)場(chǎng)離奇詭異橄镜,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)冯乘,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門洽胶,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人裆馒,你說(shuō)我怎么就攤上這事姊氓。” “怎么了喷好?”我有些...
    開(kāi)封第一講書人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵翔横,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我梗搅,道長(zhǎng)禾唁,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任无切,我火速辦了婚禮荡短,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘哆键。我一直安慰自己掘托,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布籍嘹。 她就那樣靜靜地躺著闪盔,像睡著了一般。 火紅的嫁衣襯著肌膚如雪辱士。 梳的紋絲不亂的頭發(fā)上泪掀,一...
    開(kāi)封第一講書人閱讀 48,970評(píng)論 1 284
  • 那天,我揣著相機(jī)與錄音颂碘,去河邊找鬼异赫。 笑死,一個(gè)胖子當(dāng)著我的面吹牛凭涂,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播贴妻,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼切油,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了名惩?” 一聲冷哼從身側(cè)響起澎胡,我...
    開(kāi)封第一講書人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后攻谁,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體稚伍,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年戚宦,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了个曙。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡受楼,死狀恐怖垦搬,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情艳汽,我是刑警寧澤猴贰,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布,位于F島的核電站河狐,受9級(jí)特大地震影響米绕,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜馋艺,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一栅干、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧丈钙,春花似錦非驮、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至星岗,卻和暖如春填大,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背俏橘。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工允华, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人寥掐。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓靴寂,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親召耘。 傳聞我的和親對(duì)象是個(gè)殘疾皇子百炬,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容