DNA甲基化數(shù)據(jù)分析(一)

Hi,大家好。最近在幫師姐分析甲基化土至,順便就把甲基化分析過程整理一下购对。
我們先來看看什么是DNA甲基化。
DNA甲基化(DNA methylation)為DNA化學(xué)修飾的一種形式陶因,能夠在不改變DNA序列的前提下骡苞,改變遺傳表現(xiàn)。所謂DNA甲基化是指在DNA甲基化轉(zhuǎn)移酶的作用下,在基因組CpG二核苷酸的胞嘧啶5號碳位共價鍵結(jié)合一個甲基基團解幽。大量研究表明贴见,DNA甲基化能引起染色質(zhì)結(jié)構(gòu)、DNA構(gòu)象躲株、DNA穩(wěn)定性及DNA與蛋白質(zhì)相互作用方式的改變片部,從而控制基因表達[2]。
在成熟體細胞組織中霜定,DNA甲基化一般發(fā)生于CpG雙核苷酸(CpG dinucleotide)部位吞琐;而非CpG甲基化則于胚胎干細胞中較為常見[1,2]然爆。植物體內(nèi)胞嘧啶的甲基化則可分為對稱的CpG(或CpNpG),或是不對稱的CpNpNp形式(C與G是堿基黍图;p是磷酸根曾雕;N指的是任意的核苷酸)。DNA甲基化可以理解為基因組上的表觀修飾助被,也就是說甲基化可以導(dǎo)致基因失活剖张,去甲基化則代表基因的激活與表達。

從公司拿到DNA甲基化測序數(shù)據(jù)后揩环,我們就可以進行DNA甲基化分析了搔弄。

DNA甲基化數(shù)據(jù)處理所使用的軟件為Bismark(https://www.bioinformatics.babraham.ac.uk/projects/bismark/).

依賴軟件
需要用戶提前安裝好Bowtie2(http://bowtie-bio.sourceforge.net/bowtie2/index.shtml)和Hisat2(https://ccb.jhu.edu/software/hisat2/index.shtml),bam文件輸出需要提前安裝Samtools(http://samtools.sourceforge.net/)

一、下載軟件
我們可以從官網(wǎng)直接下載丰滑,也可以從GitHut(https://github.com/FelixKrueger/Bismark)下載

image.png

下載好顾犹,進入Bismark

git clone https://github.com/FelixKrueger/Bismark.git
cd Bismark 
./bismark_genome_preparation –version
image.png

接下來分析,我們使用軟件中的示例文件,在travis_files文件中

cd travis_files
ls 
image.png

二褒墨、對基因組構(gòu)建索引

/bismark/bismark_genome_preparation --path_to_aligner /usr/bin/bowtie2/ --verbose /data/travis_files

結(jié)果生成Bisulfite_Genome文件夾,使用tree命令查看文件夾下都有什么文件


image.png

三炫刷、運行bismark, 進行比對
對于雙端測序

bismark --genome ./travis_files/ -1 ./travis_files/test_R1.fastq.gz -2 ./travis_files/test_R2.fastq.gz -p 2 -o ./results/

這里將輸出兩個文件:

  1. test_R1_bismark_bt2_pe.bam (contains all alignments plus methylation call strings)
  2. test_R1_bismark_bt2_PE_report.txt (contains alignment and methylation summary)

四、刪除重復(fù)數(shù)據(jù)

./deduplicate_bismark --bam ./results/test_R1_bismark_bt2_pe.bam --output_dir ./results/

五郁妈、提取甲基化位點

./bismark_methylation_extractor -p --gzip --bedGraph --buffer_size 10G --cytosine_report --comprehensive --genome_folder ./travis_files/ ./results/test_R1_bismark_bt2_pe.bam -o ./results/

--cytosine_report生成基因組中所有cytosine的全基因組甲基化報告浑玛。
--comprehensive會合并正反鏈的數(shù)據(jù),輸出CpG/CHG/CHH三種類型的甲基化文件噩咪,包含了胞嘧啶所有的組合形式顾彰,但我們最關(guān)注的是CpG位點的甲基化。


image.png

六胃碾、生成處理報告和總結(jié)報告
./bismark2report
./bismark2summary

結(jié)果解析
bismark2report此腳本使用Bismark比對報告來生成圖形HTML報告頁涨享。
即test_R1_bismark_bt2_PE_report.html, 它包括了比對信息,甲基化信息仆百,M-bias等灰伟,我們可以簡單看一下


image.png

image.png

image.png

image.png

image.png

image.png

image.png

前面已經(jīng)提到使用--comprehensive,會輸出CpG/CHG/CHH三種類型的甲基化文件,其中CpG_context_test_R1_bismark_bt2_pe.txt.gz即為CpG甲基化位點的文件栏账。

less CpG_context_test_R1_bismark_bt2_pe.txt.gz
image.png

文件中每一列含義
第一列是測序信息
第二列為甲基化狀態(tài)帖族,+為甲基化,-為為甲基化
第三列為染色體
第四列為起始位置(等于終止位置)
第五列為methylation call strings, 即大寫就是甲基化

  • z - C in CpG context - unmethylated
  • Z - C in CpG context - methylated
  • x - C in CHG context - unmethylated
  • X - C in CHG context - methylated
  • h - C in CHH context - unmethylated
  • H - C in CHH context - methylated
  • u - C in Unknown context (CN or CHN) - unmethylated
  • U - C in Unknown context (CN or CHN) - methylated
  • . - not a C or irrelevant position

test_R1_bismark_bt2_pe.bismark.cov.gz提供了每個位點的甲基化比例

less test_R1_bismark_bt2_pe.bismark.cov.gz
image.png

第一列為染色體
第二列為起始位置
第三列為終止位置
第四列為甲基化比例
第五列為甲基化個數(shù)
第六列為未甲基化個數(shù)

如何你還有其他問題挡爵,可以直接看軟件里面README.md,也可以咨詢我竖般。

參考:
1.Dodge, Jonathan E.; Bernard H. Ramsahoyeb, Z. Galen Woa, Masaki Okanoa, En Li. De novo methylation of MMLV provirus in embryonic stem cells: CpG versus non-CpG methylation. Science Direct. May 2002 [2007-06-23].
2.百度百科

  1. DNA甲基化測序數(shù)據(jù)處理(一):數(shù)據(jù)比對http://www.reibang.com/p/5d7e550abc1a?from=singlemessage
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市茶鹃,隨后出現(xiàn)的幾起案子涣雕,更是在濱河造成了極大的恐慌,老刑警劉巖闭翩,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件挣郭,死亡現(xiàn)場離奇詭異,居然都是意外死亡疗韵,警方通過查閱死者的電腦和手機兑障,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蕉汪,“玉大人流译,你說我怎么就攤上這事≌甙蹋” “怎么了福澡?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長驹马。 經(jīng)常有香客問我革砸,道長,這世上最難降的妖魔是什么糯累? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任业岁,我火速辦了婚禮,結(jié)果婚禮上寇蚊,老公的妹妹穿的比我還像新娘笔时。我一直安慰自己,他們只是感情好仗岸,可當(dāng)我...
    茶點故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布允耿。 她就那樣靜靜地躺著,像睡著了一般扒怖。 火紅的嫁衣襯著肌膚如雪较锡。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天盗痒,我揣著相機與錄音蚂蕴,去河邊找鬼低散。 笑死,一個胖子當(dāng)著我的面吹牛骡楼,可吹牛的內(nèi)容都是我干的熔号。 我是一名探鬼主播,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼鸟整,長吁一口氣:“原來是場噩夢啊……” “哼引镊!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起篮条,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤弟头,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后涉茧,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體赴恨,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年伴栓,在試婚紗的時候發(fā)現(xiàn)自己被綠了伦连。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡挣饥,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出沛膳,到底是詐尸還是另有隱情扔枫,我是刑警寧澤,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布锹安,位于F島的核電站短荐,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏叹哭。R本人自食惡果不足惜忍宋,卻給世界環(huán)境...
    茶點故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望风罩。 院中可真熱鬧糠排,春花似錦、人聲如沸超升。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽室琢。三九已至乾闰,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間盈滴,已是汗流浹背涯肩。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人病苗。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓疗垛,卻偏偏與公主長得像,于是被迫代替她去往敵國和親铅乡。 傳聞我的和親對象是個殘疾皇子继谚,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,700評論 2 345

推薦閱讀更多精彩內(nèi)容