主要是來自紀(jì)偉講測序的組學(xué)相關(guān)視頻和專欄
文章1 蛋白糖基化修飾
視頻:https://www.bilibili.com/video/BV1hz4y1r74a
數(shù)據(jù):
????1樣本臨床信息矩陣? 包括多種腫瘤樣本
? ? 2蛋白總體表達量矩陣? 100多個樣本X8000多個蛋白
? ? 3SPEG糖基化修飾矩陣? ? 樣本X糖基化肽段量
? ? 4IGP糖基化修飾矩陣?樣本X糖基化肽段量
1 聚類箕般!
對三種組學(xué)的樣本進行聚類夹界,發(fā)現(xiàn)聚類結(jié)果具有保守性(一致性),區(qū)分了患者的亞群
這里使用z-score的log表達量隘世,選擇了變異系數(shù)最大的50個基因進行聚類可柿,為的就是讓差異變大,更好的區(qū)分亞群
然后計算每個組的每個亞群和其他組亞群之間的相關(guān)性丙者,(每個亞群取均值)复斥,發(fā)現(xiàn)IGP作為分類標(biāo)準(zhǔn)分的效果最好
然后可以用每個樣本的聚類信息與樣本的臨床信息之間再做相關(guān)性分析,比如
? ? ? ? ? ? ? ? 樣本A? ? 樣本B? ?樣本C?樣本D 樣本E
聚類? ? ? ? ? ?1? ? ? ? ? ? ?2? ? ? ? ? 2? ? ? ? ? 3? ? ? ? ?3? ? ? ? ?
腫瘤類型? ? 1? ? ? ? ? ? ?2? ? ? ? ? ?3? ? ? ? ? ? 1? ? ? ? ? ?3
就可以計算聚類和腫瘤類型的相關(guān)性
在樣本層面的聚類后又對基因?qū)用孢M行聚類械媒,利用IGP數(shù)據(jù)把基因聚成3類目锭,分別是得出每個類的相關(guān)通路
基因?qū)用婷總€類也進行了對每個類和糖基化修飾類型的關(guān)系,發(fā)現(xiàn)也高度相關(guān)
自己對基因聚類完了以后纷捞,還可以用其他人研究出來的基因劃分標(biāo)準(zhǔn)進行劃分痢虹,比較自己的聚類和標(biāo)準(zhǔn)的分類
用基因類型去看這些樣本類之間的表達量變化