Cell | 3'UTR變體的全基因組功能篩查--揭示人類疾病與進(jìn)化驅(qū)動(dòng)因素
原創(chuàng)?huacishu?圖靈基因?今天
收錄于話題#前沿生物大數(shù)據(jù)分析
撰文:huacishu
IF=41.581
推薦度:?????
亮點(diǎn):
1顷啼、作者開(kāi)發(fā)了3′非翻譯區(qū)(3′UTR)大規(guī)模平行報(bào)告基因測(cè)定法(MPRAu)踏枣,能夠靈敏地測(cè)定12173個(gè)3′UTR變異。
2钙蒙、作者將MPRAu應(yīng)用于六個(gè)人類細(xì)胞系茵瀑,重點(diǎn)研究與全基因組關(guān)聯(lián)研究(GWAS)和人類進(jìn)化適應(yīng)有關(guān)的遺傳變異。
3仪搔、作者揭示了數(shù)百個(gè)3′UTR的因果變體瘾婿,這些變體在遺傳學(xué)上有細(xì)微的表型關(guān)聯(lián),并報(bào)道了年齡相關(guān)性黃斑變性中轉(zhuǎn)錄變化的一個(gè)因果變體烤咧。
近日哈佛大學(xué)系統(tǒng)生物學(xué)中心Sabeti博士團(tuán)隊(duì)在國(guó)際知名期刊cell在線發(fā)表題為“Genome-wide functional screen of 3’UTR variants uncovers causal variants for human disease and evolution”的研究論文偏陪。3'非翻譯區(qū)(3'UTR)變異與人類疾病密切相關(guān),但是它們之間的因果關(guān)系還沒(méi)有被完全確定煮嫌。作者開(kāi)發(fā)了3'UTR的大規(guī)模平行報(bào)告分析(MPRAu)笛谦,來(lái)解析12173個(gè)3'UTR變體。將MPRAu應(yīng)用于六種人類細(xì)胞系昌阿,重點(diǎn)關(guān)注與全基因組關(guān)聯(lián)研究(GWAS)和人類進(jìn)化適應(yīng)相關(guān)的遺傳變異饥脑。MPRAu擴(kuò)展了對(duì)3'UTR功能的理解恳邀,表明簡(jiǎn)單序列主要闡釋3'UTR調(diào)節(jié)活性。采用MPRAu來(lái)揭示堿基對(duì)分辨率的不同分子機(jī)制灶轰,包括富含腺苷酸尿苷酸(AU)的LEPR元素與東亞人潛在的代謝進(jìn)化的適應(yīng)有關(guān)谣沸。推薦了數(shù)百個(gè)3'UTR變異體,這些變異體具有遺傳精細(xì)定位的表型關(guān)聯(lián)笋颤。利用內(nèi)源性等位基因替換乳附,繼而描述了一種干擾調(diào)節(jié)病毒防御基因TRIM14的miRNA位點(diǎn)的變體和一種改變PILRB豐度的變體,指出了導(dǎo)致年齡相關(guān)性黃斑變性轉(zhuǎn)錄變化的原因變體伴澄。
應(yīng)用MPRAu系統(tǒng)地評(píng)估了來(lái)自3'UTR的遺傳變異的功能效應(yīng)赋除。為此,作者設(shè)計(jì)并合成了100個(gè)來(lái)自人類3'UTR的堿基對(duì)(bp)寡核苷酸非凌,以變體的“參考”(ref)或“替代”(alt)等位基因?yàn)橹行模▓D1A)举农,用于MPRAu的測(cè)試。首先試圖確保分析能夠再現(xiàn)預(yù)期的3'UTR生物學(xué)效應(yīng)敞嗡。與3'UTR抑制轉(zhuǎn)錄表達(dá)的主要調(diào)節(jié)功能一致颁糟,所有MPRAu測(cè)試的3'UTR的主要作用是降低mRNA豐度(圖1B)。在所有細(xì)胞類型的實(shí)驗(yàn)復(fù)制之間的標(biāo)準(zhǔn)化RNA讀取計(jì)數(shù)的強(qiáng)相關(guān)性中可重復(fù)觀察到該效應(yīng)(圖1C)秸妥。作者確信該分析能夠評(píng)估具有調(diào)節(jié)活性的寡核苷酸滚停,然后通過(guò)比較相同3'UTR等位基因之間的表達(dá)變化來(lái)確定改變3'UTR功能的tamVars(圖1D)沃粗。在所有細(xì)胞類型中共發(fā)現(xiàn)2368個(gè)tamVars粥惧。為了評(píng)估tamVars的細(xì)胞特異性,應(yīng)用mash發(fā)現(xiàn)tamVars在所有六種細(xì)胞類型(81.2%)中大部分是共享的最盅,而對(duì)一種細(xì)胞類型(1.6%)具有特異性(圖1E突雪、1F)。對(duì)轉(zhuǎn)染了測(cè)試文庫(kù)子集的HEK293細(xì)胞進(jìn)行了分析涡贱,發(fā)現(xiàn)RNA表達(dá)與穩(wěn)態(tài)RNA表達(dá)高度相關(guān)咏删。此外,多體RNA和穩(wěn)態(tài)RNA之間的變異效應(yīng)是一致的问词。為了證明變異效應(yīng)可直接翻譯到蛋白質(zhì)水平督函,還通過(guò)熒光素酶分析測(cè)試了tamVar和非tamVar對(duì)照的子集。結(jié)果觀察到熒光素酶發(fā)光分析與MPRAu測(cè)量的大范圍效應(yīng)大小的等位基因偏斜(圖1G)之間存在強(qiáng)烈的相關(guān)性激挪,這也突出了MPRAu在低通量熒光素酶方法中對(duì)3'UTR變異效應(yīng)進(jìn)行分類的能力辰狡,多聚體分析和熒光素酶與MPRAu的一致性表明,該分析的RNA豐度測(cè)量在表型水平上是有意義的垄分。
為了證實(shí)MPRAu效應(yīng)與3'UTR生物學(xué)的分子機(jī)制一致宛篇,作者分析了整個(gè)寡核苷酸序列的特征。結(jié)果發(fā)現(xiàn)鳥(niǎo)嘌呤胞嘧啶(GC)含量和二級(jí)結(jié)構(gòu)與衰減水平正相關(guān)(圖2A)薄湿。這一發(fā)現(xiàn)可以解釋為高GC含量和結(jié)構(gòu)性在RBP占有率中的作用叫倍,從而解釋其功能性偷卧。在更精細(xì)的序列水平上,MPRAu從經(jīng)驗(yàn)RBP基序和預(yù)測(cè)的miRNA基序的存在中捕捉到預(yù)期的衰減和增強(qiáng)效應(yīng)吆倦。如富含腺苷酸尿苷酸(AU)的元件和miRNA基序等調(diào)控特征對(duì)表達(dá)表現(xiàn)出預(yù)期的衰減效應(yīng)(圖2B)听诸。干擾這些預(yù)測(cè)元素的變體消除了功能效應(yīng)(圖2B)。強(qiáng)調(diào)MPRAu捕捉內(nèi)源性干擾效應(yīng)的能力蚕泽,具有高背景活性的寡核苷酸和具有高等位基因偏斜的變體也主要存在于體內(nèi)RBP占有率特征升高的區(qū)域(圖2C)蛇更。作者發(fā)現(xiàn),給定在細(xì)胞系中轉(zhuǎn)錄水平的衰減和等位基因傾斜通常由該細(xì)胞系中大量表達(dá)的miRNA決定赛糟,這證明了MPRAu捕獲甚至相對(duì)罕見(jiàn)的細(xì)胞類型特異性效應(yīng)的能力(圖2D)派任。這些數(shù)據(jù)共同證明了MPRAu檢測(cè)已知3'UTR細(xì)胞類型特異性調(diào)節(jié)機(jī)制作用的能力。
在確定了MPRAu轉(zhuǎn)錄水平下的關(guān)鍵3'UTR特征后璧南,作者訓(xùn)練了測(cè)試序列的預(yù)測(cè)模型掌逛,并比較了幾種分類模型的敏感性和特異性,以預(yù)測(cè)活性減弱的3'UTR元件司倚。結(jié)果發(fā)現(xiàn)該模型在所有模型類型中表現(xiàn)良好豆混,平均精度為0.23–0.48,接收器工作特性曲線下的面積為0.67–0.79(圖3A和3B)动知。值得注意的是皿伺,最佳模型比其他幾個(gè)測(cè)試的分類模型表現(xiàn)得更好,包括使用百分比U的單變量控制模型盒粮。從僅使用序列特異性注釋的模型中鸵鸥,發(fā)現(xiàn)幾個(gè)特征對(duì)于使用Shapley加法注釋(SHAP)進(jìn)行預(yù)測(cè)非常重要。這些特征包括均多聚物長(zhǎng)度丹皱、序列多樣性以及與尿嘧啶含量相關(guān)的各種特征妒穴,如U/UC百分比和UA/UU二核苷酸計(jì)數(shù)(圖3C)。通過(guò)研究這些重要特征的個(gè)體效應(yīng)摊崭,發(fā)現(xiàn)mfe與衰減預(yù)測(cè)呈單調(diào)負(fù)相關(guān)讼油。還發(fā)現(xiàn)百分比GC與mfe反相關(guān),因此與衰減呈正相關(guān)(圖3D)呢簸。具體而言矮台,較長(zhǎng)的尿嘧啶多聚物表現(xiàn)出最弱的活性(圖3D),與它們作為許多RBP結(jié)合基序的功能一致根时。衰減的識(shí)別特征可能有助于構(gòu)建具有精確表達(dá)水平的合成3'UTR瘦赫。
接下來(lái)將GM12878中的tamVars與Geuvadis RNA測(cè)序(RNA seq)數(shù)據(jù)集中雜合子個(gè)體的細(xì)胞類型匹配等位基因特異性表達(dá)(ASE)數(shù)據(jù)進(jìn)行比較,并使用此比較來(lái)估計(jì)分析中tamVars的陽(yáng)性預(yù)測(cè)值(PPV)啸箫。結(jié)果觀察到TamVar和內(nèi)源性觀察到的ASE之間具有中等強(qiáng)度的一致性(圖4A)耸彪。接著擴(kuò)展了分析,將TamVar與組織EQTL進(jìn)行比較忘苛,從遺傳精細(xì)定位中獲得了假定的因果等位基因蝉娜。通過(guò)聚集不同細(xì)胞類型和組織的等位基因效應(yīng)唱较,觀察到具有高因果關(guān)系概率的變體在聚集MPRAu和GTEx中間效應(yīng)大小之間的方向性上顯示出顯著一致性(圖4B)。隨著因果關(guān)系(PIP)閾值的增加召川,MPRAu功能更加豐富(圖4C)南缓。這表明,除了引起體內(nèi)基因表達(dá)變化外荧呐,研究中確定的TamVar具有表型效應(yīng)汉形,MPRAu是關(guān)聯(lián)研究的有力方法。當(dāng)將MPRAu等位基因偏斜與罕見(jiàn)變異功能指標(biāo)進(jìn)行比較時(shí)倍阐,觀察到顯著的正相關(guān)(圖4D)概疆。這一發(fā)現(xiàn)表明,MPRAu可以識(shí)別常見(jiàn)和罕見(jiàn)的3'UTR變體的功能峰搪,而現(xiàn)代關(guān)聯(lián)研究的檢測(cè)能力較低岔冀。
作者發(fā)現(xiàn)3'UTR拼接有助于識(shí)別RBP序列基序。rs16975240(CIBAR2)顯示出強(qiáng)烈的等位基因傾斜概耻,ref等位基因表現(xiàn)出強(qiáng)烈的表達(dá)衰減使套。然而,alt等位基因表現(xiàn)出一種靜音效應(yīng)鞠柄,這表明衰減元件的擾動(dòng)侦高。在ref背景上,變量位置和上游10個(gè)基點(diǎn)之間的刪除確定了這樣一個(gè)元素厌杜,當(dāng)刪除該元素時(shí)奉呛,會(huì)減輕這種衰減。正如在alt背景中所預(yù)期的期奔,相同序列的刪除產(chǎn)生的變化最小侧馅。飽和突變?cè)趓ef區(qū)域發(fā)現(xiàn)了一個(gè)10 bp的基序危尿,與U1小核核糖核蛋白(snRNP)結(jié)合序列一致性完全匹配(圖5A)呐萌。在alt背景下,tamVar周圍45 bp窗口內(nèi)的刪除將表達(dá)恢復(fù)到接近ref水平谊娇,這表明存在重疊的功能元素肺孤。RNAfold預(yù)測(cè)該區(qū)域的莖環(huán)結(jié)構(gòu),可能介導(dǎo)這種衰減(圖5B)济欢。這兩個(gè)3'UTR等位基因都表現(xiàn)出衰減赠堵,但alt等位基因表現(xiàn)出明顯更強(qiáng)的效應(yīng),這在熒光素酶分析中得到了驗(yàn)證法褥。缺失映射了一個(gè)25 bp的富含AU元素茫叭,該元素由已知施加衰減效應(yīng)的AUUUA五聚體重復(fù)組成(圖5C)。
rs705866(PILRB)與年齡相關(guān)性黃斑變性相關(guān)半等,位于從標(biāo)簽SNP到強(qiáng)LD的151個(gè)SNP中(圖6A)揍愁。MPRAu鑒定了ref等位基因的暗示等位基因效應(yīng)呐萨,該等位基因?qū)Ρ磉_(dá)具有減弱作用(圖6B)。為了證實(shí)內(nèi)源性基因組背景下的MPRAu等位基因效應(yīng)莽囤,使用CRISPR對(duì)神經(jīng)元SK-N-SH細(xì)胞中的rs705866進(jìn)行等位基因替換谬擦。將來(lái)自具有所需編輯的細(xì)胞的RNA和DNA的等位基因比率與未受干擾的細(xì)胞進(jìn)行比較,發(fā)現(xiàn)等位基因傾斜與MPRAu測(cè)量的效應(yīng)一致(圖6C)朽缎。研究該變異的序列背景表明惨远,它可能與幾個(gè)RBP或一個(gè)miRNA結(jié)合』靶ぃ基因組顯示rs1059273周圍的擴(kuò)展單體型雜合性得分坊夫,但識(shí)別因果等位基因仍然很困難(圖6D)屡拨。MPRAu確定了ref背景的衰減效應(yīng),但未確定alt(圖6E)。rs1059273破壞miRNA結(jié)合位點(diǎn)(hsa-miR-142-3p)为居,可能解釋alt等位基因的高表達(dá)(圖6E)。轉(zhuǎn)染miRNA抑制劑消除了使用陰性對(duì)照抑制劑未觀察到的等位基因歪斜(圖6F)讥巡,提供了hsa-miR-142-3p在機(jī)制上對(duì)等位基因傾斜的證據(jù)肖爵。
作者開(kāi)發(fā)的MPRAu,這是一種高通量的工具悄泥,可以從功能上描述3'UTR變體虏冻,并使用它來(lái)識(shí)別2368個(gè)3'UTR變體,這些變體在六個(gè)細(xì)胞系中調(diào)節(jié)轉(zhuǎn)錄物的豐度弹囚。作者建立了3'UTR功能的強(qiáng)大預(yù)測(cè)模型厨相,并確定了3'UTR調(diào)節(jié)模式。作者預(yù)計(jì)MPRAu將成為一種常見(jiàn)的實(shí)驗(yàn)?zāi)J脚葛模糜跍y(cè)試意義未知的變異和未來(lái)罕見(jiàn)的變異蛮穿。將來(lái),MPRAu可能會(huì)進(jìn)一步修改毁渗,以特異性檢測(cè)影響特定調(diào)控機(jī)制的變體践磅,如轉(zhuǎn)錄終止或mRNA定位,以及研究已經(jīng)鑒定的許多TamVar的miRNA/RBP機(jī)制灸异。雖然目前的檢測(cè)方法并不是最佳的設(shè)計(jì)來(lái)獲得3'UTR變異對(duì)APA的影響府适,但未來(lái)的修改也可以讓人們更全面地檢測(cè)這些變異功能》握粒總的來(lái)說(shuō)檐春,MPRAu提供了一個(gè)框架,用于根據(jù)功能對(duì)3'UTR的監(jiān)管變化進(jìn)行優(yōu)先排序么伯。該研究有助于進(jìn)一步更全面地理解非編碼變異功能的重要調(diào)控過(guò)程疟暖。
教授介紹
Sabeti博士是哈佛大學(xué)系統(tǒng)生物學(xué)中心以及生物和進(jìn)化生物學(xué)的教授,也是麻省理工學(xué)院和哈佛大學(xué)博德研究所的成員。Pardis Sabeti從事計(jì)算遺傳學(xué)和傳染病研究俐巴,主要研究領(lǐng)域有兩個(gè)朋贬。首先,Sabeti和她的團(tuán)隊(duì)開(kāi)發(fā)了研究人員可以輕松利用的方法和工具窜骄,以打開(kāi)人類基因組生物學(xué)和醫(yī)學(xué)研究的新領(lǐng)域锦募。其次,他們綜合了來(lái)自廣泛不同領(lǐng)域的見(jiàn)解和工具——如人類基因組學(xué)邻遏、病毒測(cè)序糠亩、信息理論——以創(chuàng)建檢測(cè)、控制和治療致命病毒性疾病的綜合方法准验。他們的努力包括應(yīng)對(duì)埃博拉赎线、寨卡、腮腺炎和新冠病毒的傳播糊饱。以通訊作者在相關(guān)雜志上發(fā)表論文多篇垂寥。
參考文獻(xiàn)
Griesemer D, Xue JR, Reilly SK, et al. Genome-wide functional screen of3'UTR variants uncovers causal variants for human disease and evolution. Cell.2021;S0092-8674(21)00999-5. doi:10.1016/j.cell.2021.08.025