基礎(chǔ)知識(shí)
甲基化
- DNA鏈上的CG位點(diǎn)能夠被甲基化酶的修飾下凰兑,在胞嘧啶上添加甲基從而發(fā)生甲基化塘装,如果一段DNA片段富含CG序列的密度比平均密度高1020倍赴涵,GC含量大于50%辞色,長(zhǎng)度大于200bp的區(qū)域愉镰,稱為CpG島(CpG island)米罚。如果某一區(qū)域高度甲基化,一般認(rèn)為在順式調(diào)控元件部位(包括啟動(dòng)子丈探、增強(qiáng)子等部位)甲基化录择,將影響DNA的結(jié)構(gòu),從而阻遏該部位基因的轉(zhuǎn)錄。
轉(zhuǎn)錄因子
- 轉(zhuǎn)錄因子(TF糊肠,transcription factor)是與基因5'端上游序列結(jié)合從而影響基因轉(zhuǎn)錄的蛋白辨宠。
- DNA雙鏈上與轉(zhuǎn)錄因子結(jié)合的位點(diǎn)稱之為轉(zhuǎn)錄因子結(jié)合位點(diǎn)(TFBS, transcription factor binding site),這個(gè)位點(diǎn)一般是實(shí)驗(yàn)分析出來(lái)的货裹,但是有時(shí)候TFBS的堿基序列并不會(huì)一直不變嗤形,因此引入了轉(zhuǎn)錄因子幾何基序的概念(TFBM,transcription factor binding motif)弧圆,以此來(lái)代表一個(gè)TF的結(jié)合特異性赋兵,通常通過(guò)匯總一系列結(jié)合位點(diǎn)的保守和可變位點(diǎn)而來(lái)。
450K甲基化芯片
- 目前進(jìn)行甲基化分析常規(guī)使用的是450K芯片(Illumina HumanMethylation450 BeadChip)
- 送檢的每個(gè)樣本在單獨(dú)的陣列(紅色通道和綠色通道)上進(jìn)行測(cè)量搔预,陣列上有45萬(wàn)個(gè)CpG位點(diǎn)霹期,每一個(gè)位點(diǎn)具有兩種不同的測(cè)量值:甲基化以及非甲基化的測(cè)量值。
- 這兩種值是通過(guò)“Type I”或“Type II”中的一種方式進(jìn)行測(cè)量拯田。
- “Type I”用來(lái)只測(cè)量一種的顏色历造,而在這一個(gè)顏色通道中包括兩種不同的探針來(lái)分別測(cè)量甲基化以及未甲基化值
- “Type II”只有一個(gè)探針,但有雙色通道來(lái)測(cè)量甲基化與未甲基化的值
- 注意:芯片中船庇,探針和CpG位點(diǎn)并非一一對(duì)應(yīng)吭产,450K芯片一共有48萬(wàn)多個(gè)探針,但所包含的CpG位點(diǎn)差不多在45萬(wàn)個(gè)左右鸭轮。
- 一個(gè)芯片包括12個(gè)陣列臣淤,每一個(gè)陣列可以分析一個(gè)樣本,一次可以同時(shí)分析8張芯片窃爷,即一次最多分析96個(gè)樣本
指標(biāo):M值和β值
- 450K甲基化芯片能夠?qū)?yīng)一個(gè)CpG位點(diǎn)測(cè)出甲基化測(cè)量信號(hào)強(qiáng)度(M邑蒋,methylated value)
- 非甲基化信號(hào)強(qiáng)度(U,unmethylated value)
- β值=M/(M+U+offset)按厘,offset是偏移量医吊,防止分母出現(xiàn)0的情況
- M值=log2(M/U),也就是根據(jù)熒光信號(hào)進(jìn)行l(wèi)og化
- β值更加適合進(jìn)行甲基化水平的定量刻剥,能夠闡明生物學(xué)意義遮咖,任何等于或大于0.6的β值都被認(rèn)為是完全甲基化的
- 任何等于或小于0.2的β值被認(rèn)為是完全未甲基化的滩字,β值在0.2和0.6之間被認(rèn)為是部分甲基化的
- M值更適合用于進(jìn)行下游統(tǒng)計(jì)分析
R包的使用教程
Minfi包
- 下載與加載
#BiocManager::install("minfi")
library("minfi")
library(minfiData)