R實戰(zhàn) | NGS數(shù)據(jù)時間序列分析(maSigPro)

R實戰(zhàn) | NGS數(shù)據(jù)時間序列分析(maSigPro)

[圖片上傳失敗...(image-5355e7-1653975368931)]

[圖片上傳失敗...(image-533c51-1653975368931)]

跟著Cell學(xué)作圖 | 6.時間序列分析(Mfuzz包)

一個答疑教程竖伯。

[圖片上傳失敗...(image-95c0e7-1653975368931)]

22

示例數(shù)據(jù)

#BiocManager::install('maSigPro')
library(maSigPro)
# 載入示例數(shù)據(jù)
data(data.abiotic) 
data.abiotic[1:5,1:5]
data(edesign.abiotic)
head(edesign.abiotic)
> data.abiotic[1:5,1:5]
        Control_3H_1 Control_3H_2 Control_3H_3 Control_9H_1 Control_9H_2
STMDF90   0.13735714   -0.3653065  -0.15329448   0.44754535  0.287476796
STMCJ24           NA           NA           NA           NA           NA
STMJH42   0.07864449    0.1002328  -0.17365488  -0.25279484  0.184855409
STMDE66   0.22976991    0.4740975   0.46930716   0.37101059 -0.004992029
STMIX74   0.14407618   -0.4801864  -0.07847999   0.05692331  0.013045420
> head(edesign.abiotic)
             Time Replicate Control Cold Heat Salt
Control_3H_1    3         1       1    0    0    0
Control_3H_2    3         1       1    0    0    0
Control_3H_3    3         1       1    0    0    0
Control_9H_1    9         2       1    0    0    0
Control_9H_2    9         2       1    0    0    0
Control_9H_3    9         2       1    0    0    0

注意:data.abiotic是已經(jīng)標準化過的基因表達矩陣

建立回歸模型

生成回歸矩陣(makeDesignMatrix)

design <- make.design.matrix(edesign.abiotic, degree = 2)
design$groups.vector

示例數(shù)據(jù)有三個時間的,故考慮二次回歸模型(degree = 2)姑尺。

> design$groups.vector
 [1] "ColdvsControl" "HeatvsControl" "SaltvsControl" "Control"      
 [5] "ColdvsControl" "HeatvsControl" "SaltvsControl" "Control"      
 [9] "ColdvsControl" "HeatvsControl" "SaltvsControl"

尋找重要基因(p.vector)

F檢驗確定回歸方程的顯著性慎恒,采用BH的校正方式和悦,校正多重假設(shè)檢驗的p值赋焕。

校正后的p值小于p.vector的參數(shù)Q的基因就作為候選基因,進行下一步的分析强挫。通過fit$SELEC可以得到候選基因的表達量信息岔霸。

fit <- p.vector(data.abiotic, # 標準化的表達矩陣 
                design, # 實驗設(shè)計的矩陣 make.design.matrix 生成
                Q = 0.05, # 顯著性水平
                MT.adjust = "BH", 
                min.obs = 20 
                # 最低表達樣本數(shù) 不應(yīng)小于(degree+1)xGroups+1 
                )
fit$i # 顯著性基因的數(shù)量 
fit$SELEC # 顯著性基因表達矩陣

尋找顯著性差異(T.fit)

上述的回歸方程是基于所有的自變量的組合構(gòu)建的,接下來就是通過逐步回歸法確定最佳的自變量組合俯渤。

tstep <- T.fit(fit, # p.vector結(jié)果
               step.method = "backward", 
               alfa = 0.05) # 在逐步回歸中用于變量選擇的顯著性水平

在挑選最佳的自變量組合時呆细,通過每種自變量組合對應(yīng)的回歸模型的擬合優(yōu)度值R-squared來進行判斷,R-squared取值范圍為0到1八匠,數(shù)值越大絮爷,越接近1,回歸模型的效果越好坑夯。

獲取顯著性基因列表(get.siggenes)

sigs <- get.siggenes(tstep, # T.fit結(jié)果
                     rsq = 0.6, # 逐步回歸中的R-squared截至值
                     vars = "groups")
# vars參數(shù)有3種
# all  每個基因直接給出一個最佳的回歸模型
# groups  只給出不同實驗條件下相比control組中的差異基因
# each 會給出時間點和實驗條件的所有組合對應(yīng)差異基因列表
names(sigs)
names(sigs$sig.genes$ColdvsControl)
sigs$sig.genes$ColdvsControl$sig.profiles # 查看cold vs control的結(jié)果

結(jié)果可視化

韋恩圖(suma2Venn)

suma2Venn(sigs$summary[, c(2:4)]) # 左圖
suma2Venn(sigs$summary[, c(1:4)]) # 右圖
# 這個韋恩圖面積大小與數(shù)量不成比例 較普通

[圖片上傳失敗...(image-53f699-1653975368931)]

see.genes()

see.genes(sigs$sig.genes$ColdvsControl, # 差異基因表達矩陣
          show.fit = T, # 是否顯示回歸擬合線(虛線)
          dis =design$dis, # 回歸設(shè)計矩陣
          cluster.method="hclust" , # 聚類方法
          cluster.data = 1, 
          k = 9) # 聚類數(shù)目

[圖片上傳失敗...(image-e14690-1653975368931)]

這一步生成兩個圖柜蜈,如圖可分別查看缆娃。注意調(diào)整圖片顯示區(qū)域大小崇渗,以免報錯纵寝。

[圖片上傳失敗...(image-d192c2-1653975368931)]

[圖片上傳失敗...(image-6a30f8-1653975368931)]

PlotGroups()

選擇某一特定genes的表達進行可視化。

# 選取STMDE66基因
STMDE66 <- data.abiotic[rownames(data.abiotic)=="STMDE66", ]
PlotGroups (STMDE66, 
            edesign = edesign.abiotic)

[圖片上傳失敗...(image-ba61b6-1653975368931)]

# 添加回歸擬合線
PlotGroups (STMDE66, 
            edesign = edesign.abiotic, 
            show.fit = T, 
            dis = design$dis, 
            groups.vector = design$groups.vector)

[圖片上傳失敗...(image-cb99f-1653975368931)]

示例數(shù)據(jù)和代碼領(lǐng)取

詳見:https://mp.weixin.qq.com/s/MFdPrXrD_gErao-Jtsu6Fg

參考

Bioconductor - maSigPro(https://bioconductor.org/packages/release/bioc/html/maSigPro.html)

往期內(nèi)容

  1. (免費教程+代碼領(lǐng)取)|跟著Cell學(xué)作圖系列合集
  2. Q&A | 如何在論文中畫出漂亮的插圖必搞?
  3. Front Immunol 復(fù)現(xiàn) | 4. 使用estimate包評估腫瘤純度
  4. R繪圖 | 氣泡散點圖+擬合曲線
  5. 跟著 Cell 學(xué)作圖 | 桑葚圖(ggalluvial)
  6. R繪圖 | 對比條形圖+連線
  7. R繪圖 | 一幅小提琴圖的美化之旅
  8. R實戰(zhàn) | 給聚類加個圈圈(ggunchull)
  9. R繪圖 | 描述性統(tǒng)計常用圖(散點圖+柱狀圖+餅圖)

[圖片上傳失敗...(image-d6ce5c-1653975368931)]# R實戰(zhàn) | NGS數(shù)據(jù)時間序列分析(maSigPro)

[圖片上傳失敗...(image-50f56f-1653975368931)]

[圖片上傳失敗...(image-3758c5-1653975368931)]

跟著Cell學(xué)作圖 | 6.時間序列分析(Mfuzz包)

一個答疑教程敬察。

[圖片上傳失敗...(image-1297de-1653975368931)]

22

示例數(shù)據(jù)

#BiocManager::install('maSigPro')
library(maSigPro)
# 載入示例數(shù)據(jù)
data(data.abiotic) 
data.abiotic[1:5,1:5]
data(edesign.abiotic)
head(edesign.abiotic)
> data.abiotic[1:5,1:5]
        Control_3H_1 Control_3H_2 Control_3H_3 Control_9H_1 Control_9H_2
STMDF90   0.13735714   -0.3653065  -0.15329448   0.44754535  0.287476796
STMCJ24           NA           NA           NA           NA           NA
STMJH42   0.07864449    0.1002328  -0.17365488  -0.25279484  0.184855409
STMDE66   0.22976991    0.4740975   0.46930716   0.37101059 -0.004992029
STMIX74   0.14407618   -0.4801864  -0.07847999   0.05692331  0.013045420
> head(edesign.abiotic)
             Time Replicate Control Cold Heat Salt
Control_3H_1    3         1       1    0    0    0
Control_3H_2    3         1       1    0    0    0
Control_3H_3    3         1       1    0    0    0
Control_9H_1    9         2       1    0    0    0
Control_9H_2    9         2       1    0    0    0
Control_9H_3    9         2       1    0    0    0

注意:data.abiotic是已經(jīng)標準化過的基因表達矩陣鳞芙。

建立回歸模型

生成回歸矩陣(makeDesignMatrix)

design <- make.design.matrix(edesign.abiotic, degree = 2)
design$groups.vector

示例數(shù)據(jù)有三個時間的,故考慮二次回歸模型(degree = 2)贷盲。

> design$groups.vector
 [1] "ColdvsControl" "HeatvsControl" "SaltvsControl" "Control"      
 [5] "ColdvsControl" "HeatvsControl" "SaltvsControl" "Control"      
 [9] "ColdvsControl" "HeatvsControl" "SaltvsControl"

尋找重要基因(p.vector)

F檢驗確定回歸方程的顯著性镊尺,采用BH的校正方式朦佩,校正多重假設(shè)檢驗的p值。

校正后的p值小于p.vector的參數(shù)Q的基因就作為候選基因庐氮,進行下一步的分析语稠。通過fit$SELEC可以得到候選基因的表達量信息。

fit <- p.vector(data.abiotic, # 標準化的表達矩陣 
                design, # 實驗設(shè)計的矩陣 make.design.matrix 生成
                Q = 0.05, # 顯著性水平
                MT.adjust = "BH", 
                min.obs = 20 
                # 最低表達樣本數(shù) 不應(yīng)小于(degree+1)xGroups+1 
                )
fit$i # 顯著性基因的數(shù)量 
fit$SELEC # 顯著性基因表達矩陣

尋找顯著性差異(T.fit)

上述的回歸方程是基于所有的自變量的組合構(gòu)建的弄砍,接下來就是通過逐步回歸法確定最佳的自變量組合仙畦。

tstep <- T.fit(fit, # p.vector結(jié)果
               step.method = "backward", 
               alfa = 0.05) # 在逐步回歸中用于變量選擇的顯著性水平

在挑選最佳的自變量組合時,通過每種自變量組合對應(yīng)的回歸模型的擬合優(yōu)度值R-squared來進行判斷音婶,R-squared取值范圍為0到1慨畸,數(shù)值越大,越接近1衣式,回歸模型的效果越好寸士。

獲取顯著性基因列表(get.siggenes)

sigs <- get.siggenes(tstep, # T.fit結(jié)果
                     rsq = 0.6, # 逐步回歸中的R-squared截至值
                     vars = "groups")
# vars參數(shù)有3種
# all  每個基因直接給出一個最佳的回歸模型
# groups  只給出不同實驗條件下相比control組中的差異基因
# each 會給出時間點和實驗條件的所有組合對應(yīng)差異基因列表
names(sigs)
names(sigs$sig.genes$ColdvsControl)
sigs$sig.genes$ColdvsControl$sig.profiles # 查看cold vs control的結(jié)果

結(jié)果可視化

韋恩圖(suma2Venn)

suma2Venn(sigs$summary[, c(2:4)]) # 左圖
suma2Venn(sigs$summary[, c(1:4)]) # 右圖
# 這個韋恩圖面積大小與數(shù)量不成比例 較普通

[圖片上傳失敗...(image-70965a-1653975368931)]

see.genes()

see.genes(sigs$sig.genes$ColdvsControl, # 差異基因表達矩陣
          show.fit = T, # 是否顯示回歸擬合線(虛線)
          dis =design$dis, # 回歸設(shè)計矩陣
          cluster.method="hclust" , # 聚類方法
          cluster.data = 1, 
          k = 9) # 聚類數(shù)目

[圖片上傳失敗...(image-a2527d-1653975368931)]

這一步生成兩個圖,如圖可分別查看碴卧。注意調(diào)整圖片顯示區(qū)域大小弱卡,以免報錯。

[圖片上傳失敗...(image-a09102-1653975368931)]

[圖片上傳失敗...(image-a4c051-1653975368931)]

PlotGroups()

選擇某一特定genes的表達進行可視化住册。

# 選取STMDE66基因
STMDE66 <- data.abiotic[rownames(data.abiotic)=="STMDE66", ]
PlotGroups (STMDE66, 
            edesign = edesign.abiotic)

[圖片上傳失敗...(image-1045d2-1653975368931)]

# 添加回歸擬合線
PlotGroups (STMDE66, 
            edesign = edesign.abiotic, 
            show.fit = T, 
            dis = design$dis, 
            groups.vector = design$groups.vector)

[圖片上傳失敗...(image-2d7f07-1653975368931)]

示例數(shù)據(jù)和代碼領(lǐng)取

點贊婶博、在看 本文,分享至朋友圈集贊20個保留30分鐘荧飞,截圖發(fā)至微信mzbj0002領(lǐng)取凡人。

木舟筆記2022年度VIP可免費領(lǐng)取

木舟筆記2022年度VIP企劃

權(quán)益:

  1. 2022年度木舟筆記所有推文示例數(shù)據(jù)及代碼(在VIP群里實時更新)垢箕。

    <img src="https://mzbj-1312199408.cos.ap-shanghai.myqcloud.com/image-20220529221704900.png" alt="image-20220529221704900" style="zoom:67%;" />

  2. 木舟筆記科研交流群划栓。

  3. 半價購買跟著Cell學(xué)作圖系列合集(免費教程+代碼領(lǐng)取)|跟著Cell學(xué)作圖系列合集兑巾。

收費:

**99¥/人**条获。可添加微信:`mzbj0002` 轉(zhuǎn)賬蒋歌,或直接在文末打賞帅掘。

<img src="https://mzbj-1312199408.cos.ap-shanghai.myqcloud.com/image-20220529221602758.png" alt="image-20220529221602758" style="zoom:50%;" />

參考

Bioconductor - maSigPro(https://bioconductor.org/packages/release/bioc/html/maSigPro.html)

往期內(nèi)容

  1. (免費教程+代碼領(lǐng)取)|跟著Cell學(xué)作圖系列合集
  2. Q&A | 如何在論文中畫出漂亮的插圖?
  3. Front Immunol 復(fù)現(xiàn) | 4. 使用estimate包評估腫瘤純度
  4. R繪圖 | 氣泡散點圖+擬合曲線
  5. 跟著 Cell 學(xué)作圖 | 桑葚圖(ggalluvial)
  6. R繪圖 | 對比條形圖+連線
  7. R繪圖 | 一幅小提琴圖的美化之旅
  8. R實戰(zhàn) | 給聚類加個圈圈(ggunchull)
  9. R繪圖 | 描述性統(tǒng)計常用圖(散點圖+柱狀圖+餅圖)

[圖片上傳失敗...(image-fc3c55-1653975368931)]

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末堂油,一起剝皮案震驚了整個濱河市修档,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌府框,老刑警劉巖吱窝,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡院峡,警方通過查閱死者的電腦和手機兴使,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來照激,“玉大人发魄,你說我怎么就攤上這事×├” “怎么了励幼?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長口柳。 經(jīng)常有香客問我苹粟,道長,這世上最難降的妖魔是什么跃闹? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任六水,我火速辦了婚禮,結(jié)果婚禮上辣卒,老公的妹妹穿的比我還像新娘掷贾。我一直安慰自己,他們只是感情好荣茫,可當我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布想帅。 她就那樣靜靜地躺著,像睡著了一般啡莉。 火紅的嫁衣襯著肌膚如雪港准。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天咧欣,我揣著相機與錄音浅缸,去河邊找鬼。 笑死魄咕,一個胖子當著我的面吹牛衩椒,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播哮兰,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼毛萌,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了喝滞?” 一聲冷哼從身側(cè)響起阁将,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎右遭,沒想到半個月后做盅,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體缤削,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年吹榴,在試婚紗的時候發(fā)現(xiàn)自己被綠了僻他。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡腊尚,死狀恐怖吨拗,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情婿斥,我是刑警寧澤劝篷,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站民宿,受9級特大地震影響娇妓,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜活鹰,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一哈恰、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧志群,春花似錦着绷、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至桑涎,卻和暖如春彬向,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背攻冷。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工娃胆, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人等曼。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓里烦,卻偏偏與公主長得像,于是被迫代替她去往敵國和親涉兽。 傳聞我的和親對象是個殘疾皇子招驴,可洞房花燭夜當晚...
    茶點故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容