背景:
吸煙是許多人類疾病的危險(xiǎn)因素。DNA甲基化與吸煙有關(guān)槐臀,但中國(guó)人群吸煙的全基因組甲基化數(shù)據(jù)有限锄蹂。
目標(biāo):
我們的目的是研究中國(guó)人群中與吸煙有關(guān)的表觀基因組范圍的甲基化。
方法:
我們使用甲基化陣列測(cè)量了來自白細(xì)胞的DNA中> 485,000個(gè)CpG位點(diǎn)(CpGs)的甲基化水平峰档,并在總共596名中國(guó)參與者中進(jìn)行了DNA甲基化和吸煙的全基因組薈萃分析败匹。我們進(jìn)一步評(píng)估了吸煙相關(guān)CpG與內(nèi)部多環(huán)芳烴(PAH)生物標(biāo)志物的關(guān)聯(lián)及其與相應(yīng)基因表達(dá)的相關(guān)性。
結(jié)果:
我們鑒定了318個(gè)CpGs讥巡,其甲基化水平與吸煙在全基因組水平有顯著關(guān)聯(lián)(錯(cuò)誤發(fā)現(xiàn)率<0.05)掀亩,其中注釋到123個(gè)基因的161個(gè)CpGs在歐洲人和非裔美國(guó)人的近期研究中與吸煙無關(guān)。在這些與吸煙有關(guān)的CpGs中欢顷,80 CpGs的甲基化水平與相應(yīng)基因(包括RUNX3槽棍,IL6R,PTAFR抬驴,ANKRD11炼七,CEP135和CDH23)的表達(dá)顯著相關(guān),并且15 CpGs的甲基化與尿2-羥基萘顯著相關(guān)布持,最具代表性的吸煙生物標(biāo)志物是內(nèi)部單羥基-PAH豌拙。
結(jié)論:
我們?cè)谥袊?guó)人群中發(fā)現(xiàn)了與吸煙相關(guān)的DNA甲基化標(biāo)記,包括一些與基因表達(dá)相關(guān)的標(biāo)記题暖。暴露于萘是煙草煙霧的副產(chǎn)物按傅,可能與吸煙相關(guān)的甲基化有關(guān)。
介紹
由于直接吸煙或間接吸煙胧卤,每年有近600萬人死于煙草[ 世界衛(wèi)生組織(世衛(wèi)組織唯绍,2014年)]。吸煙是煙草消費(fèi)的主要方法枝誊,是可預(yù)防疾部雒ⅰ(包括心血管疾病,呼吸道疾病和癌癥)的主要原因(Cunningham等人2014 ; Rea等人2002 ; Sosnowski和Przewo?niak2015)和死亡率(Ezzati)和Lopez 2003 ; Mathers和Loncar 2006)叶撒。已經(jīng)在香煙煙霧中發(fā)現(xiàn)了各種人類致癌物绝骚,包括多環(huán)芳烴(PAHs)[ 國(guó)際癌癥研究機(jī)構(gòu)(IARC)2004 ;疾病控制和預(yù)防中心(CDC)2010 ; 羅德曼等人耐版。2000年 ]。雖然吸煙對(duì)健康的不良影響已得到公認(rèn)皮壁,但對(duì)其潛在的毒性機(jī)制知之甚少椭更,特別是在分子水平上哪审。
DNA甲基化是基因組的表觀遺傳修飾蛾魄,參與調(diào)節(jié)基因表達(dá)和基因組穩(wěn)定性(Lee和Pausova 2013)。甲基化狀態(tài)可以通過遺傳和環(huán)境因素進(jìn)行修改湿滓,并且可以將基因和環(huán)境的影響整合到表型或疾病上(Feil和Fraga 2012 ; Schadt 2009)滴须。先前使用靶向方法(全球甲基化和候選基因甲基化)的研究已經(jīng)確定了吸煙與DNA甲基化之間的潛在聯(lián)系(Furniss等人2008 ; Philibert等人2010 ; Smith等人2007)但是直到廣泛使用全基因組甲基化技術(shù)才發(fā)現(xiàn)了數(shù)百種與吸煙有關(guān)的甲基化標(biāo)記,并評(píng)估了它們與吸煙相關(guān)疾病的關(guān)系(Besingi和Johansson叽奥,2014; Breitling等扔水,2011 ; Elliott等)人2014。 ; Harlid等人2014朝氓。 ; 茹貝爾等人2012魔市。 ; Markunas等人2014。 ; 申科等人2013赵哲。 ; Sun等人2013待德。 ; 。塞林格等人2013)枫夺。以前全球范圍內(nèi)的吸煙甲基化分析已在歐洲人中進(jìn)行過(Guida等人2015 ; Shenker等人2013 ;Zeilinger等人将宪。2013)和非裔美國(guó)人(Dogan等人2014 ; Philibert等人2013 ; Sun等人2013); 然而,中國(guó)這個(gè)世界上最大的卷煙生產(chǎn)國(guó)和客戶的中等收入國(guó)家的人口尚未得到評(píng)估橡庞。
為了研究中國(guó)人群中與吸煙有關(guān)的表觀基因組范圍的甲基化改變较坛,我們測(cè)量了外周血白細(xì)胞中> 485,000 CpG位點(diǎn)(CpGs)的DNA甲基化水平,并對(duì)DNA甲基化和吸煙進(jìn)行了全基因組薈萃分析扒最。共有596名中國(guó)參與者丑勤。此外,我們調(diào)查了吸煙相關(guān)CpGs與注釋基因表達(dá)的相關(guān)性以及它們與尿液?jiǎn)瘟u基-PAH(OH-PAH)代謝物的相關(guān)性吧趣。
方法
研究參與者
在本研究中,從中國(guó)武漢和廣東的焦氏聯(lián)合法竞、急性冠狀動(dòng)脈(ACS)患者和武漢-珠海(WHZH)隊(duì)列中,對(duì)596名中國(guó)參與者進(jìn)行了DNA甲基化和吸煙全基因組薈萃分析。聯(lián)合(參見圖 S1,了解研究的流程圖)再菊。
The Coke Oven Cohort爪喘。2010年,中國(guó)武漢的焦?fàn)t廠共招募了1,628名煉焦?fàn)t工人( Li et al.2012)纠拔。根據(jù)以下標(biāo)準(zhǔn)秉剑,我們?cè)诒狙芯恐屑{入了144名工人:* a)捐獻(xiàn)的血液和尿液樣本; b)在高三分位數(shù)中具有基線總尿OH-PAH(ΣOH-PAH)水平; c)在工廠工作超過5年; d)沒有自我報(bào)告的疾病或不適; e)在基線檢查后2周內(nèi)沒有發(fā)燒或傳染病; f)過去一個(gè)月沒有服用處方藥; 和 g*)體重指數(shù)(BMI)為18.0-30.5。在進(jìn)行甲基化和基因分型數(shù)據(jù)的質(zhì)量控制后稠诲,137個(gè)個(gè)體(縮寫為COW-1)保留在本研究中侦鹏。
急性冠脈綜合征患者诡曙。本研究還包括來自中國(guó)武漢的103名臨床證實(shí)的急性冠狀動(dòng)脈綜合征(ACS)患者(在協(xié)和醫(yī)院和武漢市中心醫(yī)院招募),以及來自中國(guó)廣東的103名ACS患者(在寶安醫(yī)院和人民醫(yī)院招募)珠海)略水〖勐保患者* a)由專業(yè)臨床醫(yī)生診斷為急性心肌梗塞或不穩(wěn)定型心絞痛; b)沒有并發(fā)癥,包括先天性心臟病渊涝,心肌病慎璧,自身免疫性疾病,急性感染跨释,肺結(jié)核胸私,慢性阻塞性肺病,糖尿病鳖谈,嚴(yán)重的腎臟或肝臟疾病岁疼,甲狀腺功能亢進(jìn)或惡性腫瘤; 和 c*)在入院第一天的最早方便時(shí)間捐獻(xiàn)血液樣本。我們納入了來自武漢的101名患者(縮寫為ACS-1)和來自廣東的97名患者(縮寫為ACS-2)缆娃,他們?cè)诒痉治鲋型ㄟ^了甲基化數(shù)據(jù)和基因分型數(shù)據(jù)的質(zhì)量控制捷绒。
武漢 - 珠海(WHZH)隊(duì)列。WHZH隊(duì)列是一個(gè)以社區(qū)為基礎(chǔ)的隊(duì)列贯要,于2011年成立暖侨,共有4,812人(武漢3,053人,珠海1,759人)在基線時(shí)被招募( Song et al.2014)郭毕。來自* a)沒有急性或慢性疾病或任何不適的所有參與者; b)臨床表現(xiàn)出異常沒有跡象; c)在基線檢查后2周內(nèi)沒有發(fā)燒或傳染病; d)過去一個(gè)月沒有服用處方藥; 和 ?)捐贈(zèng)血液和尿液樣品它碎,共計(jì)180個(gè)武漢居民選擇為ACS患者在武漢健康對(duì)照(年齡,性別和BMI匹配n* = 103)和/或健康和低PAH暴露的武漢COW控制(年齡显押,性別和BMI匹配扳肛,低三分位尿ΣOH-PAH,n = 144; ACS患者和COW共享64控制)乘碑。共有103名廣東居民被選為廣東ACS患者的健康對(duì)照(年齡挖息,性別和BMI相匹配)。我們納入了162名武漢居民和99名廣東居民(縮寫為WHZH)兽肤,他們?cè)诒痉治鲋型ㄟ^了甲基化和基因分型數(shù)據(jù)的質(zhì)量控制套腹。
研究甲基化表達(dá)相關(guān)性的受試者。為了研究DNA甲基化與基因表達(dá)之間的相關(guān)性资铡,我們?cè)?015年4月和5月在中國(guó)十堰東風(fēng)中心醫(yī)院(東風(fēng)汽車公司和湖北醫(yī)學(xué)院)健康檢查中心招募了144名參加定期健康檢查的人員电禀。所選參與者符合以下標(biāo)準(zhǔn):* a)年齡為20至70歲; b)沒有自我報(bào)告的疾病或不適; c)在基線檢查后2周內(nèi)沒有發(fā)燒或傳染病; d)過去一個(gè)月沒有服用處方藥; 和 e*)捐獻(xiàn)血液和尿液樣本。所有144名受試者(縮寫為SY)的甲基化和表達(dá)數(shù)據(jù)通過質(zhì)量控制并包括在本分析中笤休。
我們的研究得到了同濟(jì)醫(yī)學(xué)院倫理委員會(huì)的批準(zhǔn)尖飞,并獲得了每位參與者的書面知情同意書。我們要求所有參與者都要消耗平淡的飲食,并在捐獻(xiàn)血液樣本前禁食至少12小時(shí)政基。根據(jù)相同的方案收集來自所有研究小組的生物樣品贞铣,并在類似條件下儲(chǔ)存。
實(shí)驗(yàn)室分析
Illumina HumanMethylation450 BeadChip沮明。使用BioTeke Whole Blood DNA Extraction Kit(BioTeke)從全血中提取基因組DNA辕坝,然后儲(chǔ)存在-80℃。根據(jù)制造商的說明荐健,使用Zymo EZ DNA甲基化試劑盒(Zymo Research)將1微克的每種樣品轉(zhuǎn)化為亞硫酸氫鹽酱畅,然后稀釋至60ng /μL的濃度。使用具有4-μL亞硫酸氫鹽轉(zhuǎn)化的樣品的HumanMethylation450 BeadChip(Illumina)在> 485,000CpG下測(cè)定DNA甲基化摧扇。
HumanHT-12 v4表達(dá)BeadChip圣贸。在采血后立即從全血中分離白細(xì)胞挚歧,并使用TRIzol?LS溶液(Invitrogen)根據(jù)制造商的說明分離血液白細(xì)胞的總RNA扛稽。根據(jù)Illumina的標(biāo)準(zhǔn)方案,使用HumanHT-12 v4 Expression BeadChip陣列滑负,由商業(yè)公司(ETMD在张,Beijing,China)分析基因表達(dá)矮慕。我們使用GenomeStudio(Illumina)獲得原始表達(dá)值帮匾,并使用分子量 - 分位數(shù)歸一化和R 3.1.2( R Core Team 2014)中的“beadarray”包( Dunning等人,2007)對(duì)表達(dá)數(shù)據(jù)進(jìn)行歸一化痴鳄。在分析之前瘟斜,將所有未表達(dá)的信號(hào)指定為0。
***尿肌酐和OH-PAH測(cè)量痪寻。WHZH(宋等人,2014年)和COW(Deng等人,2014年;Li 等人 2012 年隊(duì)列以前曾報(bào)告過螺句。將所有尿液樣品收集在無菌錐形管中并儲(chǔ)存在-20℃直至進(jìn)行實(shí)驗(yàn)室測(cè)定。PAH代謝物的鑒定和定量基于保留時(shí)間橡类,質(zhì)荷比和峰面積蛇尚,使用從單獨(dú)的內(nèi)標(biāo)溶液獲得的線性回歸曲線。在12種尿中OH-PAH代謝物中顾画,有10種非致癌代謝物取劫,包括1-羥基萘,2-羥基萘研侣,2-羥基芴谱邪,9-羥基芴,1-羥基菲庶诡,2-羥基菲惦银,3-羥基菲,4-羥基菲,9-羥基菲璧函,和1-羥基芘高于定量限(LOQ)傀蚌,因此包括在本分析中,而2種致癌代謝物蘸吓,6-羥基chrysene和3-羥基苯并[a]芘善炫,低于LOQ(Deng et al.2014 ; Li et al.2012),因此库继,在本分析中未使用箩艺。將OH-PAH水平校準(zhǔn)至尿肌酐,并以每毫摩爾肌酐的微摩爾數(shù)表示宪萄。
全基因組數(shù)據(jù)的質(zhì)量控制
我們將不同平板和珠片的樣本對(duì)(病株或暴露組)和匹配對(duì)照隨機(jī)分組艺谆,以最大限度地減少批次效應(yīng)。我們使用minfi包(Aryee等人拜英,2014)來預(yù)處理IDAT文件静汤。通過多維尺度(MDS)分析識(shí)別信號(hào)異常值。我們通過匹配Methylation450k Beadchips上的65個(gè)單核苷酸多態(tài)性(SNP)的基因型與從全基因組關(guān)聯(lián)研究(GWAS)數(shù)據(jù)獲得的相同SNP的基因型來檢查潛在的樣品混淆居凶。如果它們是:a)是65-SNP探針虫给,則排除甲基化探針; b)樣品間缺失率> 20%(缺失定義如下:某樣品的探針:檢測(cè)p值> 0.01或珠子數(shù)<3); 或者c)對(duì)于ASN群體的1000 Genomes Project 20110521版本中MAF> 0.05的SNP可能包含或延伸,或者與其他基因組位置交叉雜交(41,296個(gè)探針)侠碧。如果a)是MDS異常值抹估,則排除樣品; b)混合樣品; c)探針間缺失率> 0.05; 或d)GWAS質(zhì)量控制失敗,包括意外重復(fù)或親屬(IBD分析弄兜,PI_HAT> 0.185)药蜻,性別差異,雜合性異常值或個(gè)人呼叫率<0.98替饿。過濾后语泽,使用wateRmelon包中的dasen方法將431,369 CpGs的甲基化值標(biāo)準(zhǔn)化(Pidsley et al.2013)。在進(jìn)一步分析之前盛垦,將檢測(cè)p值> 0.01或珠子數(shù)<3的甲基化值指定為NA湿弦。
統(tǒng)計(jì)分析
DNA甲基化和吸煙的全基因組分析。在過去6個(gè)月內(nèi)平均吸煙量超過1支煙的參與者被定義為當(dāng)前吸煙者; 戒煙超過6個(gè)月的參與者被定義為前吸煙者; 并且從未在其一生中吸煙的參與者被歸類為從不吸煙者腾夯。在過去6個(gè)月內(nèi)每周飲酒1次的個(gè)人被定義為當(dāng)前飲酒者; 停止飲酒超過6個(gè)月的人被定義為前飲酒者; 從未喝過酒的人被定義為從不喝酒的人颊埃。使用SVA軟件包在每個(gè)小組中單獨(dú)進(jìn)行替代變量分析(SVA)( Leek等人,2012)蝶俱。SVA中使用的變量包括吸煙狀況(分別為0,1和2班利,分別為從不,前者和當(dāng)前吸煙者)榨呆,年齡(年份罗标,作為連續(xù)變量),性別(男性和女性編碼為1和2) (分別),飲酒狀態(tài)(分別為0,1和2分別表示從不闯割,前和現(xiàn)在的飲酒者)和BMI(每平方米千克彻消,作為連續(xù)變量)。替代變量(SV)可以捕獲全基因組數(shù)據(jù)的主要未知變異宙拉,這些變異無法通過包含的變量來解釋宾尚。使用線性回歸模型在每個(gè)組中分別進(jìn)行關(guān)聯(lián)分析,其中包括作為因變量的反正態(tài)轉(zhuǎn)換(INT)甲基化β值和作為獨(dú)立變量包括的吸煙狀態(tài)谢澈,年齡煌贴,性別,飲酒狀態(tài)锥忿,BMI和SV牛郑。在對(duì)COW和WHZH隊(duì)列的分析中,ΣOH-PAHs也作為協(xié)變量包含在模型中敬鬓,因?yàn)樵谶@兩個(gè)小組中樣本選擇中考慮了ΣOH-PAHs淹朋。使用固定效應(yīng)薈萃分析和樣本大小加權(quán)法將所有四個(gè)小組的結(jié)果組合以獲得p值和逆方差加權(quán)方法來獲得效應(yīng)大小的估計(jì)。全基因組薈萃分析的顯著性閾值是錯(cuò)誤發(fā)現(xiàn)率(FDR)<0.05列林。分析在R 3.1.2(R核心小組2014)中進(jìn)行瑞你。
CpGs與基因表達(dá)的相關(guān)性。基于Illumina提供的注釋文件配對(duì)CpG和表達(dá)探針希痴,其提供關(guān)于表達(dá)探針和CpG探針的基因組位置和基因注釋的信息。線性回歸春感,其中因變量是反正態(tài)轉(zhuǎn)換的表達(dá)值和獨(dú)立變量是甲基化值砌创,年齡和性別,用于估計(jì)甲基化和表達(dá)之間的關(guān)聯(lián)鲫懒。對(duì)于每個(gè)CpG嫩实,顯著性閾值定義為相應(yīng)基因的表達(dá)探針的0.05 /數(shù)目。
尿PAH代謝物和吸煙相關(guān)的甲基化改變窥岩。我們通過計(jì)算吸煙對(duì)每種OH-PAH代謝物的貢獻(xiàn)來評(píng)估哪些尿OH-PAHs可用作吸煙暴露的代表性生物標(biāo)志物[定義為* R *2的差異有和沒有吸煙狀態(tài)的模特之間; 其他協(xié)變量是年齡甲献,飲酒狀況,BMI颂翼,職業(yè)晃洒,地理區(qū)域和珠子片操作日期(地理區(qū)域分別為武漢和廣東分別為1和2)]使用WHZH隊(duì)列男性的線性回歸模型。在來自WHZH隊(duì)列和焦?fàn)t組的男性中分別分析吸煙相關(guān)CpG的甲基化值與尿2-羥基萘水平之間的關(guān)聯(lián)朦乏。進(jìn)行調(diào)解分析以評(píng)估2-羥基萘是否顯示吸煙對(duì)WHZH隊(duì)列男性甲基化改變的調(diào)節(jié)作用球及,并調(diào)整年齡,飲酒狀態(tài)呻疹,BMI吃引,職業(yè),差異白細(xì)胞比例,地理區(qū)域和珠子片操作日期(Valeri和Vanderweele 2013)镊尺。關(guān)聯(lián)分析在R 3.1.2(R Core Team 2014)中進(jìn)行朦佩,并且中介分析在SAS 9.2(SAS Institute Inc.)中進(jìn)行。
Results
參與者的基本特征
全基因組薈萃分析共納入596名來自中國(guó)的參與者庐氮,其中包括137名焦?fàn)t工人(107名男性;平均年齡= 46.51歲)吕粗,198名ACS患者(其中101名來自武漢,男性81名旭愧,平均年齡為廣東省58.96歲颅筋,廣東省97人,男性78人输枯,平均年齡59.37歲)议泵,WHZH隊(duì)列261名社區(qū)居民(男性206人,平均年齡53.84歲)桃熄。研究人群的特征總結(jié)在表1中先口。
表格1
研究參與者的特征(n或平均值±SD)。
特點(diǎn) DNA甲基化和吸煙的全基因組薈萃分析 用于甲基化 - 表達(dá)關(guān)聯(lián)分析的數(shù)據(jù)集
縮寫:ACS-1瞳收,來自武漢的ACS患者; ACS-2碉京,來自廣東的ACS患者; COW-1,來自可口可樂烤箱隊(duì)列的參與者; SY螟深,在十堰定期參加健康檢查的人; WHZH谐宙,居民選自武漢 - 珠海隊(duì)列。a中間細(xì)胞定義為單核細(xì)胞界弧,嗜酸性粒細(xì)胞和嗜堿性粒細(xì)胞的總和凡蜻。
DNA甲基化和吸煙的全基因組分析
在我們的全基因組甲基化薈萃分析中,我們鑒定了318個(gè)CpG垢箕,其甲基化水平與全基因組顯著性水平的吸煙相關(guān)(FDR <0.05划栓,圖1)。其中条获,在歐洲人的甲基化和吸煙的先前全基因組研究中气嫁,沒有報(bào)告注釋到123個(gè)基因的161個(gè)CpG與吸煙顯著相關(guān)(Guida等人2015 ; Shenker等人2013 ; Zeilinger等人2013)或在非裔美國(guó)人中(Dogan等人觉壶,2014 ; Philibert等人,2013 ; Sun等人,2013)(見表S1)简识。
縮寫:Chr,染色體;UTR,未翻譯區(qū)域;身體,基因體;第1次,第一個(gè)外向;TSS200,距離轉(zhuǎn)錄起始站點(diǎn)200個(gè)基點(diǎn)以內(nèi);TSS1500,距離轉(zhuǎn)錄起始站點(diǎn)1500bps以內(nèi)石挂。
a 固定效果元分析,用樣本大小加權(quán)方法獲取 p 值,采用逆方差加權(quán)方法獲取效果大小的估計(jì)值梳猪。b 以DNA甲基化水平為因變量,以吸煙狀態(tài)為因變量,調(diào)整微陣列瘸右、樣品在微陣列和血細(xì)胞組合上的位置的線性模型(Guida等人,2015年)。c 線性混合模型以甲基化β值為因變量,當(dāng)前吸煙者和包裝年為主要獨(dú)立變量,根據(jù)年齡和性別進(jìn)行調(diào)整(Sun等人,2013年)萍悴。d 在以前關(guān)于歐洲人甲基化和吸煙的全基因組研究中未報(bào)告與吸煙有顯著關(guān)聯(lián)的CpGs(Guida等人,2015年;Shenker等人,2013年;Zeilinger等人,2013年)或非洲裔美國(guó)人(多根等人2014年;菲利伯特等人2013年;Sun等人,2013年)头遭。
? 邦費(fèi)羅尼 p = 0.05寓免。? 邦費(fèi)羅尼 p = 0.05 或 FDR ±0.05
表2列出了前40名吸煙相關(guān)CpGs(FDR <0.01)的關(guān)聯(lián)結(jié)果表S2中列出了每個(gè)小組中318個(gè)吸煙相關(guān)CpG的關(guān)聯(lián)結(jié)果。
對(duì)于318 CpG中的大部分计维,我們觀察到甲基化水平從無到現(xiàn)在的吸煙者到當(dāng)前吸煙者的漸變改變趨勢(shì); 從現(xiàn)在的吸煙者到不吸煙者的甲基化改變大于從前吸煙者到不吸煙者的改變(參見表S3)袜香。
a通過調(diào)整年齡,飲酒狀況鲫惶,BMI蜈首,疾病狀態(tài),地理區(qū)域的線性回歸模型計(jì)算估計(jì)值欠母,
差異白細(xì)胞比例和珠芯片操作日期欢策。
在全基因組薈萃分析中,曼哈頓情節(jié)和QQ圖表中甲基化和吸煙之間關(guān)聯(lián)的p值赏淌。在曼哈頓圖中踩寇,X軸表示的CpG的基因組位置,所述?軸表示-log10(p關(guān)聯(lián)的-值)六水,紅色線表示-log(p在假發(fā)現(xiàn)率-值)( FDR)= 0.05俺孙。在QQ圖中,x軸表示預(yù)期的-log10(p值)掷贾,而y軸表示觀察到的-log10(p值)睛榄。
表2
在全基因組薈萃分析中,40個(gè)CpGs與吸煙有關(guān)(FDR <0.01)想帅。
縮寫:身體场靴,基因體; Chr,染色體; FDR博脑,錯(cuò)誤發(fā)現(xiàn)率; TSS200憎乙,轉(zhuǎn)錄起始位點(diǎn)200 bps以內(nèi); TSS1500,距離轉(zhuǎn)錄起始位點(diǎn)1,500 bps; UTR叉趣,非翻譯區(qū)域。a基于反正態(tài)轉(zhuǎn)換的甲基化值計(jì)算估計(jì)值该押。固定效應(yīng)薈萃分析與樣本大小加權(quán)方法一起使用以獲得p值并且使用逆方差加權(quán)方法來獲得效應(yīng)大小的估計(jì)疗杉。
與注釋基因表達(dá)的相關(guān)性
我們進(jìn)一步研究了吸煙相關(guān)CpG的甲基化值是否與144個(gè)健康個(gè)體的獨(dú)立組中相應(yīng)基因的表達(dá)相關(guān),其中甲基化組和基因表達(dá)譜均被測(cè)量(表1)蚕礼。318個(gè)吸煙相關(guān)的CpG中有77個(gè)被排除在分析之外烟具,因?yàn)闆]有為基因設(shè)計(jì)表達(dá)探針或因?yàn)檠喊准?xì)胞中的低表達(dá)率。在剩余的241個(gè)CpG(總共414個(gè)CpG表達(dá)探針對(duì))中奠蹬,對(duì)于注釋基因具有合格的表達(dá)數(shù)據(jù),我們觀察到80 CpGs的甲基化水平與其相應(yīng)基因的表達(dá)相關(guān)(p <0.05 /相應(yīng)基因的表達(dá)探針;例如冀痕,在體內(nèi)RUNX3,對(duì)于cg10951873和ILMN_1787461 言蛇,p = 1.57×10 -7 ; 在IL6R的主體上僻他,對(duì)于cg09257526和ILMN_1696394腊尚,p = 1.98×10 -9,對(duì)于cg09257526和ILMN_1754753婿斥,p = 5.61×10 -6 ; 在距離CEP135的轉(zhuǎn)錄起始位點(diǎn)1,500 bps內(nèi)劝篷,對(duì)于cg26542660和ILMN_1693766 民宿,p = 1.82×10 -2 ; 在所述主體的CDH23,p = 9.45×10 -3用于cg10750182和ILMN_1779934; 在距離PTAFR的轉(zhuǎn)錄起始位點(diǎn)1,500 bps內(nèi)峡蟋,p = 2.07×10-16 for cg20460771和ILMN_1746836; 在ANKRD11的5'非翻譯區(qū)中蕊蝗,對(duì)于cg01107178和ILMN_2108709 赖舟,p = 1.03×10 -8(參見表S4)。
縮寫:Chr,染色體; 身體石洗,基因體; TSS200讲衫,轉(zhuǎn)錄起始位點(diǎn)200 bps以內(nèi); 來自轉(zhuǎn)錄起始網(wǎng)站; UTR,非翻譯區(qū)域招驴。
TSS1500别厘,1500 bps以內(nèi)
對(duì)于每個(gè)CpG拥诡,顯著性閾值定義為相應(yīng)基因的表達(dá)探針的0.05 /數(shù)目。
吸煙相關(guān)CpGs與尿2-羥基萘的關(guān)系
由于我們研究中的大多數(shù)吸煙者是男性(98.52%)并且為了避免因職業(yè)暴露而產(chǎn)生的影響折柠,因此該分析主要在來自WHZH隊(duì)列的男性中進(jìn)行批狐。我們首先測(cè)試了哪種OH-PAH代謝物是最具代表性的吸煙生物標(biāo)志物嚣艇。我們觀察到吸煙可能占尿2-羥基萘變異的18.0%,大于吸煙對(duì)其他9種OH-PAH代謝物所解釋的變化(見表S5)困乒。
OH-PAHs水平由尿肌酐校準(zhǔn)贰谣,并表示為每OH-PAHs的微摩爾數(shù)(×10-2)為中位數(shù)(第25,75)娜搂。
模型1:線性回歸模型百宇,尿液代謝物作為因變量携御,年齡既绕,飲酒凄贩,BMI疲扎,職業(yè),地理區(qū)域珠芯片和操作日期作為自變量。 尿液中多環(huán)芳烴代謝物的濃度被轉(zhuǎn)化瓜挽。 b模型2:在模型1c中另外包括吸煙久橙。吸煙解釋每種尿OH-PAH代謝物的方差,計(jì)算為模型2解釋的方差減去模型1解釋的方差缸榄。
然后我們?cè)u(píng)估了318吸煙相關(guān)CpG的甲基化水平與尿2-羥基萘水平之間的關(guān)聯(lián)(見表S6)甚带,并且在進(jìn)行Bonferroni校正后發(fā)現(xiàn)了15個(gè)顯著相關(guān)性(p <1.57×10 -4)(圖2)鹰贵。當(dāng)僅將分析限制于非吸煙者時(shí)康嘉,這些關(guān)聯(lián)大大減弱(圖2; 另見表S6)亭珍,表明DNA甲基化與尿2-羥基萘之間的相關(guān)性主要?dú)w因于吸煙肄梨。我們進(jìn)一步研究了2-羥基萘是否可能是這些吸煙誘導(dǎo)的甲基化改變的介質(zhì),并發(fā)現(xiàn)在與2-羥基萘相關(guān)的15個(gè)CpG中财松,12個(gè)CpGs的吸煙相關(guān)甲基化變異(包括cg05575921辆毡,cg23916896舶掖,cg24090911和cg26703534)在AHRR上)可能部分地由它們與尿2-羥基萘水平的關(guān)聯(lián)介導(dǎo)(p <0.05)(表3)眨攘。
來自武漢 - 珠海(WHZH)隊(duì)列和焦?fàn)t組的男性中15種與吸煙有關(guān)的CpG和尿2-羥基萘水平的關(guān)聯(lián)鲫售。
表3
對(duì)來自武漢 - 珠海(WHZH)隊(duì)列的男性甲基化水平與尿2-羥基萘相關(guān)的15種重要CpGs進(jìn)行了中介分析该肴。
在SAS 9.2(SAS Institute Inc.)的調(diào)解宏中調(diào)整年齡匀哄,飲酒狀態(tài),體重指數(shù)挑秉,職業(yè)犀概,差異白細(xì)胞比例蒲赂,地理區(qū)域和珠子片操作日期:%宏調(diào)解(數(shù)據(jù)=滥嘴,yvar =若皱,avar) =,mvar =晦譬,cvar =敛腌,a0 =像樊,a1 =旅敷,m =媳谁,nc =晴音,yreg =锤躁,mreg =,Interaction =加缘,casecontrol = false拣宏,output = reduced勋乾,c =嗡善,boot =)(Valeri和Vanderweele 2013)罩引。甲基化值進(jìn)行反向 - 正常轉(zhuǎn)化袁铐,并且尿2-羥基萘的濃度是自然對(duì)數(shù)轉(zhuǎn)化的。
盡管來自Coke Oven隊(duì)列的受試者患有PAHs的職業(yè)暴露屉更,但在調(diào)整1-羥基芘(一種職業(yè)暴露標(biāo)記物)后瑰谜,在來自Coke Oven隊(duì)列的男性受試者中觀察到吸煙萨脑,2-羥基萘和這些CpG的甲基化之間的類似關(guān)聯(lián)模式砚哗。焦?fàn)t工人(圖2 ;另見表S6)蛛芥。
a通過線性回歸模型計(jì)算估計(jì)值仅淑。 甲基化值是反正常的
將尿2-羥基萘和1-羥基芘進(jìn)行轉(zhuǎn)化涯竟。 b調(diào)整年齡,飲酒狀況银酬,BMI揩瞪,職業(yè)李破,珠子片操作日期嗤攻,差異白細(xì)胞比例和地理區(qū)域诽俯。 c調(diào)整1-羥基芘惊畏,年齡颜启,飲酒狀態(tài)缰盏,BMI口猜,珠子片操作日期,差異白細(xì)胞比例川抡。
討論
在本研究中崖堤,我們通過對(duì)幾個(gè)中國(guó)人群中DNA甲基化的全基因組薈萃分析密幔,確定了318個(gè)與吸煙相關(guān)的CpGs胯甩。在已確定的CpGs中偎箫,注釋到123個(gè)基因的161個(gè)與最近的歐洲人研究(Guida等人2015 ; Shenker等人2013 ; Zeilinger等人2013)或非洲裔美國(guó)人(Dogan等人2014 ; Philibert)中的吸煙無關(guān)等人镜廉,2013 ; Sun等娇唯,2013)寂玲。我們還觀察到一些與吸煙有關(guān)的CpGs的甲基化水平可能會(huì)影響相應(yīng)基因的表達(dá)拓哟,而一些吸煙相關(guān)的甲基化改變可能部分是由于接觸萘而引起的断序。
雖然中國(guó)是世界上最大的煙草消費(fèi)國(guó)和生產(chǎn)國(guó)(Gu et al.2009)违诗,中國(guó)人群尚未進(jìn)行DNA甲基化和吸煙的全基因組甲基化研究诸迟。本研究在中國(guó)人群中發(fā)現(xiàn)了318例吸煙相關(guān)的CpGs阵苇,其中157例已通過之前的甲基化研究報(bào)告绅项,表明吸煙相關(guān)的甲基化改變?cè)谥袊?guó)和西方人群中主要是一致的快耿。之前在歐洲人或非洲裔美國(guó)人中報(bào)道的161個(gè)CpGs表明新的吸煙相關(guān)部位或中國(guó)人特有的部位润努,這需要通過其他中國(guó)人群的進(jìn)一步研究進(jìn)行復(fù)制。大多數(shù)鑒定的基因座都注釋了參與吸煙釋放化學(xué)物質(zhì)代謝的基因[例如痢畜,AHRR是參與異生物質(zhì)代謝的芳烴的核受體抑制劑(Shenker等人2013)]或可能與吸煙相關(guān)的健康影響[例如丁稀,F2RL3的甲基化調(diào)節(jié)吸煙的有害影響并且是相關(guān)的冠心病引起的死亡率(Breitling等凿可,2012 ; Zhang等授账,2014)]白热。
DNA甲基化可能是吸煙與人類疾病之間的潛在聯(lián)系屋确。在本研究中攻臀,與吸煙有關(guān)的甲基化改變對(duì)RUNX3刨啸,IL6R呜投,PTAFR仑荐,和ANKRD11(心血管相關(guān)基因)和CEP135和CDH23(癌癥相關(guān)基因)對(duì)應(yīng)于增加的基因表達(dá)粘招。RUNX3編碼包含runt結(jié)構(gòu)域的轉(zhuǎn)錄因子家族的成員洒扎,其可能在先天和適應(yīng)性免疫細(xì)胞類型中具有重要功能袍冷,并且可能與幾種炎癥相關(guān)疾病相關(guān)(Lotem等人2015))胡诗。白細(xì)胞介素6是一種細(xì)胞因子,在炎癥反應(yīng)中具有重要作用震庭,其調(diào)節(jié)異常與許多健康問題有關(guān)(Ferreira等器联,2013)拨拓。PTAFR編碼血小板活化因子(PAF)受體千元,其在促炎過程中起重要作用(Ninio等,2004)奥务。除了它們?cè)谥寡脱ㄐ纬芍械年P(guān)鍵作用外氯葬,血小板還參與調(diào)節(jié)炎癥和免疫反應(yīng)(von Hundelshausen和Weber帚称,2007)闯睹。ANKRD11可能參與凋亡途徑(例如楼吃,p53信號(hào)傳導(dǎo))(Lim等人孩锡,2012 ; Neilsen等人亥贸,2008)據(jù)報(bào)道荣挨,它們?cè)谛难芗膊〉陌l(fā)病機(jī)制中起著關(guān)鍵作用(Lee和Gustafsson 2009)垦沉。據(jù)推測(cè)厕倍,吸煙引起的異常生理過程可能是心血管疾病發(fā)展的重要機(jī)制(Frosteg?rd2013)讹弯。我們的研究結(jié)果表明组民,吸煙與心血管相關(guān)基因的甲基化相關(guān),這些基因與相應(yīng)的表達(dá)相關(guān)臭胜,這表明DNA甲基化可能通過吸煙誘導(dǎo)的免疫反應(yīng)莫其,炎癥反應(yīng)和細(xì)胞凋亡促進(jìn)疾病進(jìn)展。
CEP135編碼中心體蛋白耸三,其在早期中心粒生物發(fā)生過程中充當(dāng)支架蛋白(Kim等人乱陡,2008)。中心體在許多過程中起著至關(guān)重要的作用(包括組織有絲分裂紡錘體極)仪壮,中心體畸變(Nigg 2002)包含在許多人類腫瘤中(Rusan和Peifer憨颠,2007)积锅。值得注意的是爽彤,已經(jīng)在煙草 - 煙霧冷凝物中鑒定出抗有絲分裂化合物,并且吸煙可以誘導(dǎo)有絲分裂異常(Qiao等人缚陷,2003 ; Vogt Isaksen适篙,2004)。CDH23編碼鈣粘蛋白23蹬跃,其作為細(xì)胞間連接和細(xì)胞分化和細(xì)胞遷移的介質(zhì)(Agarwal 2014))匙瘪。以前的研究表明,CDH23在乳腺癌組織中上調(diào)蝶缀,并參與轉(zhuǎn)移性過程(Binai等人2013)丹喻。最近的證據(jù)表明,主動(dòng)吸煙在乳腺癌中起著潛在的因果作用(Reynolds等翁都,2009)碍论。吸煙也是許多癌癥(例如,肺癌柄慰,結(jié)腸癌和胃癌)的明確原因(Gandini等人鳍悠,2008)税娜。因此,甲基化改變可能是吸煙引起的不良反應(yīng)和癌癥的潛在機(jī)制藏研。
吸煙是PAH暴露的主要來源敬矩,特別是萘暴露(Ding等人2005 ; Jacob等人2013)。我們估計(jì)吸煙占WHZH隊(duì)列中男性尿2-羥基萘變異的18.0%蠢挡,這有助于進(jìn)一步研究尿2-羥基萘作為內(nèi)源暴露于吸煙源PAHs的可能生物標(biāo)志物弧岳。吸煙相關(guān)的AHRR甲基化改變可能是由PAHs暴露引起的(Shenker等,2013)业踏。AHRR編碼芳烴受體(AhR)的阻遏物(Harlid等禽炬,2014)。以前的研究表明勤家,AhR途徑在各種異生素(包括PAHs)的代謝中很重要(Zeilinger等人腹尖,2013),并且因接觸吸煙而被修改(Besingi和Johansson伐脖,2014)热幔。我們目前的數(shù)據(jù)表明,吸煙釋放的萘可能通過改變AhR途徑中重要基因的甲基化水平來改變AhR途徑讼庇。
不同的細(xì)胞和組織具有不同的DNA甲基化特征(Ohgane等人断凶,2008)。在本研究中使用外周血DNA是合理的巫俺,原因有兩個(gè)。首先肿男,外周血是許多吸收到人體內(nèi)的異生素的重要載體(Barr等介汹,2007); 外周血細(xì)胞與內(nèi)部形式的異生素直接接觸并對(duì)它們起反應(yīng)(Bonassi等,2007)舶沛。其次嘹承,血液樣本在大規(guī)模研究中最方便收集,使用血細(xì)胞可以將我們的結(jié)果與其他研究的結(jié)果進(jìn)行比較如庭。使用血液白細(xì)胞作為甲基化分析的DNA來源的局限性在于白細(xì)胞亞型之間的甲基化不同叹卷,并且白細(xì)胞亞型的分布可能隨暴露而變化,從而導(dǎo)致暴露與甲基化之間的關(guān)聯(lián)可能混淆(Reinius等.2012)坪它。正如之前的一項(xiàng)研究所表明的那樣骤竹,基于因子的“批量”校正方法(如替代變量分析)不僅可以控制批次效應(yīng),還可以根據(jù)經(jīng)驗(yàn)估計(jì)和控制細(xì)胞類型的成分(Jaffe和Irizarry 2014))往毡,我們?cè)谌蚪M甲基化分析中采用了替代變量來同時(shí)限制批次和細(xì)胞組合物的影響蒙揣。在研究與吸煙有關(guān)的CpG與尿2-羥基萘之間的關(guān)聯(lián)時(shí),我們?cè)诜治瞿P椭姓{(diào)整了差異性白細(xì)胞比例开瞭。然而懒震,我們不能排除與白細(xì)胞亞型變異或其他因素相關(guān)的殘留混雜的可能性罩息。此外,鑒于橫斷面研究設(shè)計(jì)个扰,我們無法建立吸煙與DNA甲基化之間的時(shí)間關(guān)系瓷炮。
結(jié)論
在中國(guó)人群中吸煙和DNA甲基化的全基因組分析的基礎(chǔ)上,我們確定了318個(gè)與吸煙有關(guān)的CpGs递宅,其中161個(gè)CpGs注釋到123個(gè)基因娘香,此前在歐洲人或非洲裔美國(guó)人中尚未報(bào)道過。一些與吸煙有關(guān)的CpG可能在基因調(diào)控中發(fā)揮作用恐锣。我們還發(fā)現(xiàn)萘可能是吸煙釋放的化學(xué)物質(zhì)之一茅主,誘導(dǎo)我們?cè)谖鼰熣咧杏^察到的甲基化改變。需要進(jìn)一步的研究來復(fù)制我們的研究結(jié)果土榴,確定它們與健康結(jié)果的潛在相關(guān)性诀姚,并闡明將吸煙與DNA甲基化聯(lián)系起來的潛在機(jī)制。
單擊此處獲取其他數(shù)據(jù)文件玷禽。(2.7M赫段,pdf)