查詢某一基因啟動子區(qū)域的CpG島潮剪,一般有兩種方法:一種是查文獻(xiàn),看您關(guān)注的基因袁稽,別人做的CpG島是哪些勿璃,這個對自己選擇位點(diǎn)有指導(dǎo)作用擒抛;另一種是UCSC數(shù)據(jù)庫中查找推汽,這種方法可以直接將該基因啟動子區(qū)域的CpG島信息都獲取下來。
我們建議兩種方法結(jié)合起來歧沪,用UCSC查詢出某基因啟動子區(qū)域所有的CpG島歹撒,參考別人的研究,最終確定自己想要研究的甲基化位點(diǎn)诊胞。
以EPB41L1為例暖夭,為大家展示一下獲取基因啟動子區(qū)域CpG島信息的操作流程锹杈。
1. 打開UCSC(http://genome.ucsc.edu/),點(diǎn)擊Human GRChg38/hg38迈着,如下圖:
2. 在空白框內(nèi)輸入“EPB41L1”竭望,同時下拉箭頭到 “regulation” 那一行,在下面 CpG Island的選擇框中選擇“show”裕菠,然后點(diǎn)擊go咬清;
**3. **接著,得到如下界面奴潘,在UCSC 上可以旧烧,看到EPB41L1這個基因內(nèi)部和基因附近有4個CpG 島,分別用紅色框出來了画髓。
EPB41L1在基因組中的坐標(biāo)為:chr20:36091504-36232799
CpG 85 在基因組中的坐標(biāo)為:chr20:36064533-36065578掘剪,其位于基因上游25926 bp 處;
CpG 178 在基因組中的坐標(biāo)為:chr20:36092082-36093626奈虾,其位于基因起始處夺谁;
CpG 45 在基因組中的坐標(biāo)為:chr20:36154402-36154787,其位于基因內(nèi)部愚墓;
CpG 29 在基因組中的坐標(biāo)為:chr20:36236366-36236700予权,位于基因下游6569 bp 處。
我們綜合看一下這四個CpG島:
CpG 85 雖然位于基因上游浪册,但是距離基因較遠(yuǎn)扫腺,因此我們認(rèn)為它不調(diào)控EPB41L1 這個基因的表達(dá)。
CpG 29雖然距離基因較近村象,但是它在基因下游笆环,目前一般研究CpG 島的多位于基因上游和基因內(nèi)部。因此我們也認(rèn)為他不調(diào)控基因的表達(dá)厚者。
綜合以上躁劣,分析部認(rèn)為EPB41L1 值得研究的CpG島有兩個,CpG178和CpG45库菲。這時可以查閱文獻(xiàn)账忘,看別人做的哪一個,作為自己選擇的參考熙宇。
**4. **下面小編以CpG178為例鳖擒,進(jìn)一步看一下如何獲取具體核酸序列,點(diǎn)擊綠色的CpG178烫止,
然后得到以下界面蒋荚,再點(diǎn)擊“View DNA for this feature”,
得到如下界面,選擇Reverse complement馆蠕,然后點(diǎn)擊“get DNA”,
最后期升, CpG178的核酸序列如下: