「來繪圖吧横媚!」鏈特異性測序的read depth繪制

以釀酒酵母為例床三,用到的數(shù)據(jù)如下一罩,
隨便找一個鏈特異性測序的fastq用常見比對軟件跑一下都行。
有一些數(shù)據(jù)我放在github撇簿,可參考:https://github.com/Youpu-Chen/Myscripts/tree/miniproject/mini-project/strand-specific-RNAseq

  • Saccharomyces cerevisiae的基因組文件
  • Saccharomyces cerevisiae的鏈特異性測序數(shù)據(jù)

上游處理

稍微解釋一下為什么要這樣做聂渊。
普通的RNA-Seq建庫測序方式差购,反轉錄得到的cDNA,連接上的adaper不具有特異性汉嗽,只是為了將目標序列連接到oligo上欲逃。最終的reads alignment無法區(qū)分開比對到某一個區(qū)域(包括positive strand和negative strand的一段基因組序列)的reads,來自該區(qū)域正負鏈的真實性饼暑。

Note:真實性稳析,指這段區(qū)域的正負鏈真的在轉錄過程中有表達reads,而不是由于反轉錄建庫而引起的弓叛。

而鏈特異性測序為例(以加入dUTP的方法為例彰居,也是使用最廣泛的一種方法)。shortgun得到目標mRNA序列之后撰筷,第二輪直接加入dUTP作為標記陈惰,之后再把含有這樣標記的序列給拿掉。那么上述的操作毕籽,就保證了最終基于read alignments的定量結果奴潘,能夠精確到正負鏈。

Note:普通的建庫測序方法影钉,就相當于放大鏡画髓,直接將大家的表達量都乘以2,最后再進行different gene expression平委。

上游分析代碼如下奈虾,

# make chromosome bed file
samtools faidx genome.fa
awk '{print $1"\t"$2}' genome.fa.fai > genome.txt
bedtools makewindows -g genome.txt -w 1000 > windows.bed

# generate depth
samtools view -f 16 -b wtssRNA_seq.fastp.sorted.sam > wtssRNA_seq.fastp.sorted.rev.bam
samtools view -F 16 -b wtssRNA_seq.fastp.sorted.sam > wtssRNA_seq.fastp.sorted.fwd.bam
bedtools coverage -a windows.bed -b input.sorted.rev.bam > rev.depth.txt
bedtools coverage -a windows.bed -b input.sorted.fwd.bam > fwd.depth.txt

下游畫圖

rm(list=ls())

# Load datasets
fwd.df <- read.delim('fwd.depth.txt', sep = '\t', header = FALSE)
names(fwd.df) <- c('chr', 'start', 'end', 'read.counts', 'base.number', 'window.size', 'average.coverage')
head(fwd.df)

rev.df <- read.delim('rev.depth.txt', sep = '\t', header = FALSE)
names(rev.df) <- c('chr', 'start', 'end', 'read.counts', 'base.number', 'window.size', 'average.coverage')
head(rev.df)


# Load packages
library(ggplot2)
library(ggpubr)


# plot
if(F){
  ### chrIV,選擇感興趣的chromosome即可廉赔。比如與人類免疫有關的chrVI就是一個非常好的可視化對象
  fwd.chrI <- fwd.df[which(fwd.df$chr == "chrIV"), ]
  rev.chrI <- rev.df[which(rev.df$chr == "chrIV"), ]
  p1 <- ggplot(data = fwd.chrI, aes(x=(start+end)/2, y = read.counts)) + 
    # geom_line() + 
    geom_area(colour = "white", fill="red", alpha=0.5, position="identity") +
    scale_x_continuous(expand = c(0, 0)) + scale_y_continuous(expand = c(0, 0), 
                                                              breaks = c(0, 250, 500, 750), 
                                                              limits = c(0, 750)) + 
    theme_classic() + 
    xlab("Chromosome IV (Bp)") +
    # ylab("Read Counts/Per 1kb") + 
    # xlab("") + 
    ylab("") +
    # theme(
    #   axis.title.x = element_text(vjust=2)
    # ) + 
    annotate("text", x = 1350000, y = 600, label = "Positive Strand", size=5)
  p1
  
  
  p2 <- ggplot(data = rev.chrI, aes(x=(start+end)/2, y = read.counts)) + 
    # geom_line() + 
    geom_area(colour = "white", fill="blue", alpha=0.5, position="identity") + 
    theme_classic() + 
    scale_x_continuous(expand = c(0, 0)) + scale_y_continuous(expand = c(0, 0), 
                                                              breaks = c(0, 250, 500, 750)) +  
    scale_y_reverse(breaks = c(0, 250, 500, 750),
                    limits = c(750, 0)) + 
    geom_hline(yintercept = 0) + 
    xlab("") + 
    ylab("") +
    annotate("text", x = 1350000, y = 600, label = "Negative Strand", size=5)
  p2
  
  
  figure <- ggarrange(p1, p2,
                      ncol = 1, nrow = 2)
  figure
  
  
  anno.fig <- annotate_figure(
    figure,
    left = text_grob("Read Depth (Per 1kb)",
                     color = "black", rot = 90)
  )
  anno.fig
  
  #save 
  ggsave('chrIV-readdepth.pdf', anno.fig, height = 6, width = 10)
}

結果圖如下肉微,


寫在后面

最近放開,陽了好多人蜡塌,但是我還是堅持能不陽就不陽的原則碉纳。結果跑來跑去的身體搞垮的,陽倒是沒陽馏艾,人感冒了劳曹。但是剛好混到一點顆粒和靠曾老師給的一箱橙子茍活。
2022年很艱難琅摩,但是只要選對方向铁孵,不斷努力就好!
年末了房资,好想寫一篇長長的總結蜕劝,來感謝我今年遇到的人和事。
這個其實是我期末大作業(yè)的一部分,若有同學有幸看到了岖沛,歡迎和我討論暑始。
還有就是關于RNA-Seq、strand-specific RNA-Seq對最后的DEG分析有沒有影響婴削,統(tǒng)計檢驗的power怎么樣蒋荚,感興趣的同學可以拿負二項分布和泊松分布擬合試試,我懶馆蠕,我不寫了期升。

參考資料

[1] Luan, H., Meng, N., Fu, J., Chen, X., Xu, X., Feng, Q., Jiang, H., Dai, J., Yuan, X., Lu, Y. and Roberts, A.A., 2014. Genome-wide transcriptome and antioxidant analyses on gamma-irradiated phases of Deinococcus radiodurans R1. PloS one, 9(1), p.e85649.

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市互躬,隨后出現(xiàn)的幾起案子播赁,更是在濱河造成了極大的恐慌,老刑警劉巖吼渡,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件容为,死亡現(xiàn)場離奇詭異,居然都是意外死亡寺酪,警方通過查閱死者的電腦和手機坎背,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來寄雀,“玉大人得滤,你說我怎么就攤上這事『杏蹋” “怎么了懂更?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長急膀。 經(jīng)常有香客問我沮协,道長,這世上最難降的妖魔是什么卓嫂? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任慷暂,我火速辦了婚禮,結果婚禮上晨雳,老公的妹妹穿的比我還像新娘行瑞。我一直安慰自己,他們只是感情好悍募,可當我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布蘑辑。 她就那樣靜靜地躺著五续,像睡著了一般牌柄。 火紅的嫁衣襯著肌膚如雪粉私。 梳的紋絲不亂的頭發(fā)上肘习,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天喜鼓,我揣著相機與錄音副砍,去河邊找鬼。 笑死庄岖,一個胖子當著我的面吹牛豁翎,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播隅忿,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼心剥,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了背桐?” 一聲冷哼從身側響起优烧,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎链峭,沒想到半個月后畦娄,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡弊仪,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年熙卡,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片励饵。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡驳癌,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出役听,到底是詐尸還是另有隱情喂柒,我是刑警寧澤,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布禾嫉,位于F島的核電站灾杰,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏熙参。R本人自食惡果不足惜艳吠,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望孽椰。 院中可真熱鬧昭娩,春花似錦、人聲如沸黍匾。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽锐涯。三九已至磕诊,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背霎终。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工滞磺, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人莱褒。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓击困,卻偏偏與公主長得像,于是被迫代替她去往敵國和親广凸。 傳聞我的和親對象是個殘疾皇子阅茶,可洞房花燭夜當晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容