02—甲基化芯片的一般分析流程

什么是甲基化芯片产园?一文了解 MethylationEPIC 850K 甲基化芯片?

簡(jiǎn)而言之,是基于亞硫酸鹽處理后的DNA序列雜交的信號(hào)探測(cè)橙凳。亞硫酸鹽是甲基化探測(cè)的:金標(biāo)準(zhǔn)“丘损,不管是芯片或者甲基化測(cè)序,都要先對(duì)DNA樣品進(jìn)行亞硫酸鹽處理奕筐。?

Illumina甲基化芯片的發(fā)展主要經(jīng)歷了27K舱痘、450K以及EPIC(即850K)(27K,450K离赫,850K指能測(cè)到的CpG甲基化位點(diǎn))芭逝,目前積累的數(shù)據(jù)主要是450K芯片的。

甲基化相關(guān)名詞

CpG 島:Defned as regions 500 bp, 55% GC and expected/observed CpG ratio of 0.65. 40% of gene promoters contain islands.

CpG shelves:~4Kb from islands.

CpG shores:~2Kb from islands, 75% of tissuespecifc differentially methylated regions found in shores. Methylation in shores shows higher correlation with gene expression than CpG islands.

Differentially methylated regions (DMR):Cell-, tissue-, and condition- specifc differences in methylation.

Enhancer(增強(qiáng)子):DNA短片段渊胸,可激活轉(zhuǎn)錄

Hypermethylation:Most cytosines are methylated.Hypomethylation:Most cytosines do not have 5-mC. Euchromatin and active gene promoters are hypomethylated.

Beta value:通常的甲基化衡量方法被稱(chēng)為“Beta”值; 等于甲基化百分比旬盯,并定義為“Meth”除以“Meth + Unmeth”。(值在0到1之間)

CGI:CpG island 即甲基化島

pd文件:探針注釋文件(3種方法獲若崦汀:從UCSC Xena下載胖翰,從GEO下載對(duì)應(yīng)平臺(tái)的注釋文件,從ChAMP包中提惹欣濉)

betaM:甲基化信號(hào)值表達(dá)矩陣萨咳,也可類(lèi)似表達(dá)矩陣下載原始數(shù)據(jù)IDAT文件后處理

甲基化芯片的計(jì)算(得到甲基化信號(hào)值矩陣)

那么當(dāng)矩陣不合理時(shí),不直接下載甲基化信號(hào)值矩陣時(shí)迂卢,可如何從原始.IDAT文件得到某弦?

1.illumina genomeStudio 軟件(局限小樣本)直接自動(dòng)原始數(shù)據(jù)IDAT轉(zhuǎn)換成甲基化信號(hào)文件,β=M/(M+U+100) 桐汤,然后使用P值對(duì)數(shù)據(jù)進(jìn)行質(zhì)量過(guò)濾,P值大于0.001的β值被認(rèn)為低于最小強(qiáng)度靶壮,閾值顯示為“NA”怔毛,因?yàn)槲矣玫氖荝和Rstudio,所以繼續(xù)往看下??

2.minfi包有g(shù)etM和getBeta函數(shù)來(lái)分別計(jì)算M-values和Beta-values? ? ?

包的作者認(rèn)為:

M-values具有更好的統(tǒng)計(jì)特性腾降,更適合用于進(jìn)行下游的統(tǒng)計(jì)分析(差異分析等): Beta-values更容易解釋?zhuān)苷f(shuō)明生物學(xué)上的意義

minfi包的一個(gè)函數(shù)read.450k.exp也可以直接讀.IDAT文件(minfi不能讀其壓縮文件)

公式計(jì)算:平均值β=信號(hào)B/(信號(hào)A+信號(hào)B+100)看情況拣度,可能是加0.001,主要是因?yàn)锽eta值在0到1 之間螃壤,加一點(diǎn)防止其為0抗果。

通過(guò)計(jì)算甲基化(信號(hào)A,對(duì)應(yīng)M)和未甲基化(信號(hào)B奸晴,對(duì)應(yīng)U)等位基因之間的強(qiáng)度比來(lái)確定DNA甲基化水平(β值),熒光信號(hào)的比率β=Max( M,O)/[Max(M.0)+Max(U,0)+100)一般來(lái)說(shuō):β值的意義

大于或等于0.6的被認(rèn)為是甲基化冤馏; 等于或小于0.2的被認(rèn)為是完全未甲基化的;? β值在0.2到0.6間被認(rèn)為是部分甲基化

3.CHAMP包下載

甲基化芯片分析需要廠商提供芯片注釋信息(注釋文件)

主要的兩種芯片450k和EPIC(即850k)寄啼,兩種探針都是以cg開(kāi)頭的數(shù)字編號(hào)逮光,芯片注釋也就是提取這些探針的所對(duì)應(yīng)的信息,如探針序列的CpG位置信息墩划,對(duì)應(yīng)的基因信息涕刚,染色體上的位置信息。很多包在安裝的時(shí)候都會(huì)自動(dòng)下載這些注釋信息乙帮,并包裝在一起杜漠,如果我們想要?自己注釋這些探針,就要考慮如何獲取獨(dú)立的注釋信息察净。而所需要注釋數(shù)據(jù)的驾茴,大部分都來(lái)自于兩個(gè)數(shù)據(jù)庫(kù),GEO和TCGA塞绿。

??三種提取注釋信息的方法:從UCSC Xena(TCGA)下載,從GEO下載對(duì)應(yīng)平臺(tái)的注釋文件,?從ChAMP包中提取?三種方法注釋甲基化探針?

例如做450的Manifest,包含了從beedchip到最終的文件的對(duì)應(yīng)號(hào)沟涨,但有部分信息要提前過(guò)濾掉,如一開(kāi)頭的Header异吻,結(jié)尾的control probe. 可從illumina官網(wǎng)直接下載對(duì)應(yīng)的注釋文件裹赴,把Header,control probe,SNP刪除后行數(shù)剛好485512。

芯片甲基化探針數(shù)量相對(duì)人類(lèi)蛋白編碼基因太大诀浪,而我們最關(guān)心的是如何確定基因的啟動(dòng)子區(qū)域甲基化水平棋返,怎么做呢?

1.定義一個(gè)基因的啟動(dòng)子

2.確定該基因的啟動(dòng)子區(qū)域的多個(gè)甲基化的探針信號(hào)值的統(tǒng)計(jì)指標(biāo)

一般分析流程(類(lèi)似mRNA芯片表達(dá)矩陣):

1.甲基化數(shù)據(jù)的下載(主要從GEO和TCGA下載,可用GEOquery從GEO中甲直接下載基化矩陣集雷猪,另外可用睛竣,用Minfi或CHAM下載原始文件.IDAT后處理。

2.數(shù)據(jù)整理求摇,探針注釋?zhuān)攸c(diǎn)在于質(zhì)量控制

3.差異甲基化射沟,三個(gè)層次的甲基化

4.熱圖殊者,火山圖,主成分分析圖

5.功能集注釋分析

6.批量位點(diǎn)甲基化和和表達(dá)相關(guān)性分析

7.批量生存分析

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末验夯,一起剝皮案震驚了整個(gè)濱河市猖吴,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌挥转,老刑警劉巖海蔽,帶你破解...
    沈念sama閱讀 218,122評(píng)論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異绑谣,居然都是意外死亡党窜,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,070評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)借宵,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)幌衣,“玉大人,你說(shuō)我怎么就攤上這事壤玫∑寐樱” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,491評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵垦细,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我挡逼,道長(zhǎng)括改,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,636評(píng)論 1 293
  • 正文 為了忘掉前任家坎,我火速辦了婚禮嘱能,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘虱疏。我一直安慰自己惹骂,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,676評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布做瞪。 她就那樣靜靜地躺著对粪,像睡著了一般。 火紅的嫁衣襯著肌膚如雪装蓬。 梳的紋絲不亂的頭發(fā)上著拭,一...
    開(kāi)封第一講書(shū)人閱讀 51,541評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音牍帚,去河邊找鬼儡遮。 笑死,一個(gè)胖子當(dāng)著我的面吹牛暗赶,可吹牛的內(nèi)容都是我干的鄙币。 我是一名探鬼主播肃叶,決...
    沈念sama閱讀 40,292評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼十嘿!你這毒婦竟也來(lái)了因惭?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,211評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤详幽,失蹤者是張志新(化名)和其女友劉穎筛欢,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體唇聘,經(jīng)...
    沈念sama閱讀 45,655評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡版姑,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,846評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了迟郎。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片剥险。...
    茶點(diǎn)故事閱讀 39,965評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖宪肖,靈堂內(nèi)的尸體忽然破棺而出表制,到底是詐尸還是另有隱情,我是刑警寧澤控乾,帶...
    沈念sama閱讀 35,684評(píng)論 5 347
  • 正文 年R本政府宣布么介,位于F島的核電站,受9級(jí)特大地震影響蜕衡,放射性物質(zhì)發(fā)生泄漏壤短。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,295評(píng)論 3 329
  • 文/蒙蒙 一慨仿、第九天 我趴在偏房一處隱蔽的房頂上張望久脯。 院中可真熱鬧,春花似錦镰吆、人聲如沸帘撰。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,894評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)摧找。三九已至,卻和暖如春牢硅,著一層夾襖步出監(jiān)牢的瞬間慰于,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,012評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工唤衫, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留婆赠,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,126評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像休里,于是被迫代替她去往敵國(guó)和親蛆挫。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,914評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容