基因表達趨勢分析-2:Mfuzz


Mfuzz能夠識別表達譜的潛在時間序列模式,并將相似模式的基因聚類姊扔,以幫助我們了解基因的動態(tài)模式和它們功能的聯(lián)系。Mfuzz的核心算法是模糊c均值聚類分析占拍,用于識別相似的基因表達譜奶浦。此外兄墅,Mfuzz提供了繪圖功能,除了實現(xiàn)基因表達譜的聚類外财喳,還能繪制時間序列察迟,清晰地為我們呈現(xiàn)基因表達的動力學特征。

圖片出自Immunity. 2020 Sep 15;53(3):685-696.e3.

Mfuzz包的使用

1. 安裝R包耳高,加載演示數(shù)據(jù)集
#Bioconductor 安裝 Mfuzz 包
BiocManager::install('Mfuzz')
library(Mfuzz) #加載
data(yeast) #Mfuzz包內部數(shù)據(jù)集扎瓶,酵母基因表達矩陣,行為基因泌枪,列為時間樣本(按時間順序來)
dat <- as.matrix(yeast@assayData$exprs)
View(dat)  #查看表達矩陣
在示例的基因表達矩陣中概荷,每一行是一種基因,列為樣本碌燕。其中误证,第一列為第一個時間點的樣本,第二列為第二個時間點的樣本修壕,以此類推愈捅。
2. 對基因表達矩陣進行標準化處理,并處理缺失值后慈鸠,執(zhí)行聚類分析蓝谨,將具有相似的時間表達模式的基因聚在一類并繪圖。
#構建對象
dat <- new('ExpressionSet',exprs = dat)

#處理 NA 值
dat <- filter.NA(dat, thres = 0.25)
# 49 genes excluded.
dat <- fill.NA(dat, mode = 'mean')

#根據(jù)標準差去除樣本間差異太小的基因
dat <- filter.std(dat, min.std = 0)
#0 genes excluded.

#標準化
dat <- standardise(dat)
Standard deviation of gene expression vectors before standardisation.
#fuzzy c-means 聚類青团,需手動定義聚類個數(shù)譬巫,比方說設置 16 個簇
n <- 16
#評估出最佳的 m 值,防止隨機數(shù)據(jù)聚類
m <- mestimate(dat)
m
# 1.15

#聚類
set.seed(2021)
cl <- mfuzz(dat, c = n, m = m)

#作圖督笆,time.labels 參數(shù)設置時間軸芦昔,和原基因表達數(shù)據(jù)集中的列對應
mfuzz.plot(dat, cl = cl, mfrow = c(4, 4), time.labels = seq(0, 160, 10))

如上過程基于基因表達值進行了聚類,對于每個簇中的基因娃肿,具有相似的時間表達特征咕缎。隨后珠十,即可從圖中識別一些重要的聚類簇,比方說簇中基因隨時間表達趨勢增加或減少凭豪,以及在特定時間出現(xiàn)了更高或更低的表達等宵睦,以建立和觀察的表型的聯(lián)系。

3. 獲取各簇中包含的基因集墅诡。
#每個簇下基因數(shù)量
cl$size
#每個基因所屬簇
head(cl$cluster)
#基因和 cluster 之間的 membership,用于判斷基因所屬簇桐智,對應最大值的那個簇
head(cl$membership)

#整合關系輸出
gene_cluster <- cbind(cl$cluster, cl$membership)
colnames(gene_cluster)[1] <- 'cluster'
write.table(gene_cluster, 'gene_cluster.txt', sep = '\t', col.names = NA, quote = FALSE)
View(gene_cluster)
前兩列就是基因名稱和聚類簇的對應關系

這樣末早,就將基因名稱和其所屬的聚類簇對應起來了。根據(jù)上文的折線圖判斷重要的時間表達模式的基因集说庭,并在該表中進一步篩選出更具體的基因名稱就可以了然磷。
得到時間序列模式后,就可以對不同時間動力學特征基因的功能分析了刊驴。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
禁止轉載姿搜,如需轉載請通過簡信或評論聯(lián)系作者。
  • 序言:七十年代末捆憎,一起剝皮案震驚了整個濱河市舅柜,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌躲惰,老刑警劉巖致份,帶你破解...
    沈念sama閱讀 216,324評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異础拨,居然都是意外死亡氮块,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評論 3 392
  • 文/潘曉璐 我一進店門诡宗,熙熙樓的掌柜王于貴愁眉苦臉地迎上來滔蝉,“玉大人,你說我怎么就攤上這事塔沃◎鹨” “怎么了?”我有些...
    開封第一講書人閱讀 162,328評論 0 353
  • 文/不壞的土叔 我叫張陵芳悲,是天一觀的道長立肘。 經(jīng)常有香客問我,道長名扛,這世上最難降的妖魔是什么谅年? 我笑而不...
    開封第一講書人閱讀 58,147評論 1 292
  • 正文 為了忘掉前任,我火速辦了婚禮肮韧,結果婚禮上融蹂,老公的妹妹穿的比我還像新娘旺订。我一直安慰自己,他們只是感情好超燃,可當我...
    茶點故事閱讀 67,160評論 6 388
  • 文/花漫 我一把揭開白布区拳。 她就那樣靜靜地躺著,像睡著了一般意乓。 火紅的嫁衣襯著肌膚如雪樱调。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,115評論 1 296
  • 那天届良,我揣著相機與錄音笆凌,去河邊找鬼。 笑死士葫,一個胖子當著我的面吹牛乞而,可吹牛的內容都是我干的。 我是一名探鬼主播慢显,決...
    沈念sama閱讀 40,025評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼爪模,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了荚藻?” 一聲冷哼從身側響起屋灌,我...
    開封第一講書人閱讀 38,867評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎应狱,沒想到半個月后声滥,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,307評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡侦香,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,528評論 2 332
  • 正文 我和宋清朗相戀三年落塑,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片罐韩。...
    茶點故事閱讀 39,688評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡憾赁,死狀恐怖,靈堂內的尸體忽然破棺而出散吵,到底是詐尸還是另有隱情龙考,我是刑警寧澤,帶...
    沈念sama閱讀 35,409評論 5 343
  • 正文 年R本政府宣布矾睦,位于F島的核電站晦款,受9級特大地震影響,放射性物質發(fā)生泄漏枚冗。R本人自食惡果不足惜缓溅,卻給世界環(huán)境...
    茶點故事閱讀 41,001評論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望赁温。 院中可真熱鬧坛怪,春花似錦淤齐、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至居灯,卻和暖如春祭务,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背怪嫌。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評論 1 268
  • 我被黑心中介騙來泰國打工待牵, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人喇勋。 一個月前我還...
    沈念sama閱讀 47,685評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像偎行,于是被迫代替她去往敵國和親川背。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,573評論 2 353

推薦閱讀更多精彩內容