在人類組織中的翻譯圖譜顯示舔箭,長(zhǎng)鏈非編碼RNA和環(huán)狀RNA上預(yù)測(cè)的致病性變異的下游經(jīng)常被翻譯,本研究描述了數(shù)百個(gè)微蛋白的翻譯情況寒矿。
Highlights
- Ribosome profiling reveals the principles of translational control in human tissue
- Ribosomes translate mRNAs downstream of protein?truncating variants
- Functionally characterized lncRNAs and circRNAs produce microproteins in vivo
- Microproteins can be implicated in mitochondrial and other cellular processes
- 核糖體圖譜揭示了人類組織中翻譯調(diào)控的原理
- 核糖體翻譯蛋白嵌合變異體
- 具有功能特征的lncRNAs和CircRNAs在體內(nèi)產(chǎn)生微蛋白
- 微蛋白可能與線粒體和其他細(xì)胞過(guò)程有關(guān)
全文總覽
人類組織中的基因表達(dá)主要在轉(zhuǎn)錄水平上進(jìn)行研究糖荒,在很大程度上忽略了翻譯調(diào)控申尤。在這里迫悠,我們分析了80個(gè)人類心臟的翻譯體鸿脓,以發(fā)現(xiàn)新的翻譯事件犹菇,并量化翻譯調(diào)控的效率。我們展示了廣泛的心臟基因表達(dá)的翻譯調(diào)控闹蒜,這是以特定過(guò)程的方式編排的寺枉。預(yù)測(cè)的致病蛋白插入變異體下游的翻譯似乎很頻繁,這表明翻譯終止效率低下绷落。我們鑒定了數(shù)百個(gè)以前沒(méi)有檢測(cè)到的微蛋白姥闪,它們是從lncRNAs和CircRNAs中表達(dá)的,我們?cè)隗w內(nèi)驗(yàn)證了這些蛋白產(chǎn)物砌烁。微蛋白的翻譯并不局限于心臟筐喳,在人類腎臟和肝臟的翻譯體中尤為突出。我們將這些微蛋白與不同的細(xì)胞過(guò)程和空間聯(lián)系起來(lái),發(fā)現(xiàn)其中許多定位于線粒體疏唾。重要的是蓄氧,數(shù)十種微蛋白是從具有良好特征的非編碼功能的lncRNA翻譯而來(lái)的,揭示了以前沒(méi)有被識(shí)別的生物學(xué)過(guò)程槐脏。
前言
翻譯調(diào)控是基因表達(dá)的一個(gè)關(guān)鍵組成部分喉童,但我們對(duì)其在人類組織中的作用的了解很少。全基因組的翻譯基因組可以使用核糖體測(cè)序(Ribo-seq)來(lái)表征顿天,它捕捉到由翻譯核糖體保護(hù)的mRNA足跡(Ingolia et al., 2009)堂氯。從這些足跡中,可以推斷核糖體的逐個(gè)密碼子移動(dòng)牌废,并用于識(shí)別主動(dòng)翻譯的開(kāi)放閱讀框架(ORFs)(Calviello and Ohler, 2017)咽白。新檢測(cè)到的ORF可以包括調(diào)控的上游ORF(uORFs),這可能會(huì)抑制mRNAs的翻譯效率(TE)(Morris and Geballe, 2000)鸟缕,或者從長(zhǎng)的非編碼RNA(LncRNAs)翻譯的短O(píng)RF(sORFs)晶框,表明有潛在的微蛋白生產(chǎn)(Andrews and Rothnagel, 2014)。對(duì)于少數(shù)微蛋白(小于100個(gè)氨基酸(aa)的蛋白質(zhì))懂从,關(guān)鍵的生理作用已被發(fā)現(xiàn)(Anderson et al., 2015, 2016a; Galindo et al., 2007; Kondo et al., 2010; Nelson et al., 2016; Pauli et al., 2014)授段,盡管缺乏人體組織中微蛋白的全基因組目錄。新檢測(cè)到的微蛋白翻譯事件可用于擴(kuò)展和改進(jìn)質(zhì)譜(MS)搜索所需的蛋白質(zhì)數(shù)據(jù)庫(kù)番甩,因?yàn)樵跊](méi)有先驗(yàn)微蛋白序列信息的情況下侵贵,利用MS從頭開(kāi)始發(fā)現(xiàn)微蛋白并不是一件容易的事。
在這里缘薛,我們闡明了80例人類心臟的翻譯圖譜窍育,包括擴(kuò)張型心肌病(DCM)患者和非擴(kuò)張型心肌病對(duì)照。擴(kuò)張型心肌病的患病率高達(dá)1:250宴胧,是需要心臟移植最常見(jiàn)的原因(Hershberger et al., 2013)漱抓。結(jié)合基因型、轉(zhuǎn)錄本和翻譯體牺汤,我們表明蛋白質(zhì)截?cái)嘧凅w(PTVs)辽旋,包括通常導(dǎo)致DCM的Titin截?cái)嘧凅w(TTNtv)浩嫌,經(jīng)常低效地終止翻譯(Herman et al., 2012)檐迟。此外,我們鑒定了169個(gè)編碼以前未知的微蛋白的lncRNAs和40個(gè)環(huán)狀RNAs(CircRNAs)码耐,我們?cè)隗w內(nèi)驗(yàn)證了它們并將其與特定的細(xì)胞過(guò)程和細(xì)胞器(主要是線粒體)聯(lián)系起來(lái)追迟。大量的微蛋白是從功能表征的lncRNAs中表達(dá)的,例如DANCR(也稱為ANCR)(Kretz et al., 2012)骚腥、TUG1(Young et al., 2005)敦间、JPX(Tian et al., 2010)、myheart (Han et al., 2014)和UPPERHAND (Anderson et al., 2016b),其中大部分的lncRNA在許多組織中普遍表達(dá)廓块,我們也描述了他們?cè)谌说哪I臟和肝臟中的翻譯厢绝。
我們做了一個(gè)對(duì)80個(gè)人類心臟的翻譯的詳細(xì)評(píng)估,這可能作為描述其他人類組織的翻譯組學(xué)的藍(lán)圖带猴。這項(xiàng)工作中提供的數(shù)據(jù)和分析可以通過(guò)http://shiny.mdc-berlin.de/cardiac-translatome/可訪問(wèn)的交互式網(wǎng)絡(luò)應(yīng)用程序進(jìn)行探索昔汉。
結(jié)果
80顆心臟中的翻譯組學(xué)一覽
為了研究心臟mRNA的表達(dá)和翻譯,我們對(duì)65名終末期DCM患者和15名非DCM對(duì)照的人左心室心肌組織進(jìn)行了mRNA測(cè)序(mRNA-SEQ)和核糖體序列分析(Ribo-seq)(圖1A拴清;圖S1A和S1B靶病;表S1)。測(cè)序的核糖體足跡顯示了預(yù)期的大小分布(圖S1C)口予,主要映射到基因的編碼序列(CDS)(圖S1D)娄周,并顯示了活躍翻譯的核糖體的3-nt密碼子運(yùn)動(dòng)特征(圖1B;為了對(duì)人類心臟中的翻譯序列進(jìn)行編目沪停,我們創(chuàng)建了從頭轉(zhuǎn)錄組組件煤辨,并使用RiboTaper對(duì)主動(dòng)翻譯的ORF進(jìn)行了無(wú)監(jiān)督搜索(Calviello et al., 2016)(圖1C;圖S1F和S1G)木张。在22,335個(gè)已鑒定的ORFs中掷酗,有1,090個(gè)uORFs(圖1D)和339個(gè)sORFs,它們都是169個(gè)假定的lncRNA的非重復(fù)序列(圖1E)窟哺。與從迄今最深的人類心臟蛋白質(zhì)組中鑒定左心室蛋白質(zhì)組(Doll et al., 2017)相比泻轰,我們從自己的Ribo-Seq數(shù)據(jù)中推斷出翻譯的基因產(chǎn)物是前人的兩倍(圖1F),可能是因?yàn)楦弑磉_(dá)的心肌肌節(jié)蛋白阻礙了MS對(duì)低表達(dá)蛋白的檢測(cè)且轨。翻譯是轉(zhuǎn)錄和蛋白質(zhì)組之間的中間步驟浮声,這與Ribo-seq對(duì)最終蛋白質(zhì)水平的預(yù)測(cè)價(jià)值高于mRNA-seq(皮爾遜相關(guān)系數(shù)[r]=0.40對(duì)0.32)(圖S1H)。所有的心臟翻譯事件都可以在表S1中找到旋奢,并且已經(jīng)被編譯到一個(gè)帶注釋的搜索數(shù)據(jù)庫(kù)中泳挥,用于基于MS的蛋白質(zhì)組學(xué),該數(shù)據(jù)庫(kù)可以從Shiny網(wǎng)絡(luò)服務(wù)器下載至朗。
人體組織中的空間轉(zhuǎn)錄和翻譯調(diào)控
比較DCM患者和對(duì)照組屉符,我們?cè)赗ibo-Seq數(shù)據(jù)中檢測(cè)到2,660個(gè)mRNA表達(dá)水平不同的基因和2,648個(gè)差異表達(dá)基因,其中964個(gè)似乎有轉(zhuǎn)錄基礎(chǔ)(圖S2A锹引;表S2)矗钟。為了確定特定翻譯調(diào)控的基因部分,我們應(yīng)用了一個(gè)相互作用模型嫌变,該模型解釋了轉(zhuǎn)錄對(duì)基因表達(dá)調(diào)控的貢獻(xiàn)(Chothani et al., 2017)吨艇,產(chǎn)生了327個(gè)翻譯下調(diào)的基因和474個(gè)翻譯上調(diào)的基因(表S2).
接下來(lái),我們將80個(gè)心臟中所有差異表達(dá)基因的翻譯水平進(jìn)行關(guān)聯(lián)腾啥,以找到特定過(guò)程的共表達(dá)調(diào)控东涡。這確定了30個(gè)共同調(diào)控的基因簇冯吓,其中22個(gè)為不同的細(xì)胞過(guò)程而富集(圖2A;圖S2B)疮跑。為了確定轉(zhuǎn)錄和翻譯對(duì)每個(gè)簇的表達(dá)調(diào)控的貢獻(xiàn)组贺,我們進(jìn)行了主成分分析(STAR方法;圖2B)祖娘。這揭示了細(xì)胞外基質(zhì)(ECM)產(chǎn)生的特異性翻譯上調(diào)(圖2B和2C)锣披,很可能是對(duì)心臟損傷和衰竭的標(biāo)志性纖維化反應(yīng)的表現(xiàn)(Travers et al., 2016)。此外贿条,我們發(fā)現(xiàn)線粒體過(guò)程的下調(diào)是在轉(zhuǎn)錄過(guò)程中啟動(dòng)的雹仿,并在翻譯水平上顯著增強(qiáng),反映了衰竭心臟的能量缺乏狀態(tài)(Okonko and Shah, 2015)整以。肌節(jié)成分大多受轉(zhuǎn)錄水平調(diào)控(圖2C)胧辽,類似于許多已知引起DCM的基因(大多數(shù)基因編碼肌節(jié)蛋白)(圖S2C)。
雷帕霉素(mTOR)信號(hào)通路靶基因是已知的心臟翻譯的主要調(diào)節(jié)因子(Sciarretta et al., 2018)公黑,位于DCM心臟中高度上調(diào)的基因簇上(圖S2B)邑商。結(jié)果,50個(gè)末端含寡嘧啶(TOP)基序的mTOR靶基因的翻譯顯著上調(diào)(Thoreen et al., 2012)()(圖S2D和S2E)凡蚜。大多數(shù)TOP基因都是核糖體蛋白人断,它們?cè)趍RNA表達(dá)減少時(shí)的翻譯上調(diào)(圖2C)表明,翻譯機(jī)制自主控制核糖體的生產(chǎn)朝蜘,并隨后在患病心臟中進(jìn)行翻譯活動(dòng)恶迈。
上游ORFs是影響翻譯效率的獨(dú)立因素
我們?cè)?19個(gè)基因(占所有翻譯基因的8%)中總共檢測(cè)到1,090個(gè)活躍翻譯的uORFs(表S3),這些基因的翻譯效率顯示如預(yù)期的下降(中位數(shù)TE谱醇,0.90比0.65暇仲;;Mann-Whitney U檢驗(yàn))(圖2D副渴;圖S2F和S2G)奈附。令人驚訝的是,我們發(fā)現(xiàn)大多uORFs和初級(jí)ORFs的翻譯率之間沒(méi)有遞減的線性關(guān)系(即反相關(guān))煮剧,而是總體上呈溫和的正相關(guān)(圖2E斥滤;表S3)。這也適用于顯示與主要ORFs起始重疊的uORFs勉盅,或具有特別強(qiáng)的翻譯起始密碼子(AUG)上下游的uORFs佑颇;例如Kozak序列(Kozak,1987)或短50UTR(TISU)元件的翻譯起始子(Elfakess and Dikstein, 2008)(圖S2H)。然后我們假設(shè)菇篡,對(duì)其他物種位置保守的uORFs可能對(duì)TE有更深遠(yuǎn)的影響漩符。在大鼠和小鼠心臟的翻譯體中,我們發(fā)現(xiàn)281個(gè)人的uORFs與嚙齒動(dòng)物的uORFs具有翻譯起始位點(diǎn)的保守性(表S1和S3)驱还,但它們對(duì)初級(jí)ORF TE沒(méi)有更強(qiáng)的作用或抑制作用(圖S2H)嗜暴。
這些分析表明,對(duì)于大多數(shù)uORFs來(lái)說(shuō)议蟆,uORF翻譯的頻率和觀察到的初級(jí)ORF TE的減少之間沒(méi)有可檢測(cè)到的數(shù)量依賴關(guān)系闷沥。然而,少數(shù)uORF在DCM心臟中被差異翻譯咐容,并與初級(jí)ORF TE存在反相關(guān)舆逃,包括ZMPSTE24和EIF4G2(圖2F)。EIF4G2含有一個(gè)50UTR的內(nèi)部核糖體進(jìn)入位點(diǎn)(IRES)戳粒,當(dāng)帽依賴的翻譯被抑制時(shí)路狮,EIF4G2可以自動(dòng)調(diào)節(jié)自己的翻譯速率(Henis-Korenblit et al., 2000),這可能有助于解釋觀察到的反相關(guān)性蔚约。ZMPSTE24的調(diào)節(jié)可能對(duì)心臟生理特別重要奄妨,因?yàn)閆MPSTE24專門處理前層蛋白A(LMNA)。ZMPSTE24突變導(dǎo)致的LMNA處理缺陷會(huì)導(dǎo)致病理性心臟擴(kuò)張苹祟,表型與LMNA突變引起的DCM相同(Galant et al., 2016; Penda′ s et al., 2002)砸抛。
自然發(fā)生的基因變異影響心臟翻譯
自然遺傳變異對(duì)人類組織翻譯調(diào)控的影響仍未被研究。因此树枫,我們從心肌組織中表達(dá)的基因的組成外顯子中鑒定了單核苷酸變體(SNVs)和小插入或缺失(indels)直焙,并測(cè)試了它們與mRNA豐度、核糖體占有率和TE的局部相關(guān)性(STAR方法砂轻;圖S3A-S3C奔誓;表S4)。我們檢測(cè)到與421個(gè)基因的mRNA豐度相關(guān)的變體(錯(cuò)誤發(fā)現(xiàn)率[FDR]<=0.05)(圖S3A)搔涝,其效果類似于基因型-組織表達(dá)(GTEx)項(xiàng)目(GTEx Consortium, 2017)和已知的左心室表達(dá)數(shù)量性狀位點(diǎn)(eQTLs; Heinig et al., 2017)丝里。這些變體中的大多數(shù)與核糖體占用無(wú)關(guān)(表S4),這與之前在類似大小的HapMap淋巴母細(xì)胞系隊(duì)列中觀察到的廣泛緩沖一致(Battle et al., 2015; Cenik et al., 2015)体谒。相反杯聚,我們檢測(cè)到81個(gè)基因的核糖體占有率與遺傳相關(guān),其中31個(gè)基因的變異與mRNA表達(dá)無(wú)關(guān)抒痒。這兩個(gè)觀察結(jié)果都表明翻譯調(diào)控與37個(gè)基因的變異與基因TES的改變顯著相關(guān)(圖S3A幌绍;圖S3D中的例子)。與TE相關(guān)的外顯子變體中沒(méi)有一個(gè)位于uORFs或Kozak序列等調(diào)控特征中故响,但據(jù)預(yù)測(cè)有8個(gè)外顯子變體會(huì)影響RNA結(jié)合蛋白(RBP)結(jié)合和RNA二級(jí)結(jié)構(gòu)(表S4,Mao et al., 2016)傀广。
PTVs通常不截?cái)嗟鞍踪|(zhì)
PTVs可以對(duì)蛋白質(zhì)功能產(chǎn)生戲劇性的影響,但醫(yī)學(xué)相關(guān)性只在PTVs的一小部分中得到確立(DeBoever et al., 2017)彩届,可能是因?yàn)榛騿涡晕北⒐δ苋哂嗷蜻^(guò)早停止密碼子讀取(Bartha et al., 2015; Huang et al., 2010; Jia et al., 2017)。在我們的隊(duì)列中樟蠕,我們檢測(cè)到346個(gè)潛在的PTVs:144個(gè)無(wú)義突變和202個(gè)移碼indels(表S4贮聂;圖S3E-S3G靠柑;STAR方法)。對(duì)于所有檢測(cè)到的PTVs吓懈,我們分析了mRNA等位基因比率和Ribo-seq覆蓋率歼冰,以估計(jì)等位基因特異性表達(dá)(ASE)和在沒(méi)有完全無(wú)意義的中間衰減產(chǎn)物(NMD)的情況下提前停止翻譯的能力。在檢測(cè)到的346個(gè)PTVs中耻警,只有32個(gè)(9.2%)顯示雜合SNV的等位基因不平衡隔嫡,(圖3A和3B;圖S3H)甘穿,表明許多截?cái)嗤蛔兊牡任换驔](méi)有經(jīng)歷廣泛的NMD腮恩。作為提前翻譯終止的衡量標(biāo)準(zhǔn),我們通過(guò)比較PTVs(STAR方法)前后的核糖體占有率來(lái)計(jì)算核糖體丟失率温兼。對(duì)于346個(gè)PTVs中只有59個(gè)(17.1%)秸滴,核糖體在引入的停止點(diǎn)下游的占有率明顯低于上游(圖3C和3D;圖S3I)妨托。因此缸榛,對(duì)于大多數(shù)可以在RNA水平上檢測(cè)到的PTVs,翻譯似乎要么被低效終止兰伤,要么在PTV下游重新啟動(dòng)内颗,可能會(huì)影響這些PTVs的功能效應(yīng)。
截短的TTN等位基因被翻譯
TTNtvs是遺傳性DCM的最常見(jiàn)原因(Herman et al., 2012)敦腔,盡管具有可變的外顯性和表達(dá)性(McNally and Mestroni, 2017)均澳。在我們的隊(duì)列中,13名DCM患者的TTNtvs位于TTN的不同組成性外顯子(圖3e符衔;表S4)找前。與先前關(guān)于人類心臟的工作(Hinson et al., 2015; Roberts et al., 2015)一致,但與兩個(gè)Ttntvs大鼠模型(Schafer et al., 2017a)相比判族,我們沒(méi)有發(fā)現(xiàn)TTNtv攜帶者中存在NMD的足夠證據(jù)(圖3F)躺盛。基于TTNtv下游核糖體足跡覆蓋的雜合子SNV形帮,提前翻譯終止對(duì)于13個(gè)TTNtv攜帶者中的4個(gè)是有效的槽惫。對(duì)于其他4個(gè)TTNtv攜帶者,翻譯似乎在TTNtv之后持續(xù)或重新啟動(dòng)(圖3G)辩撑,有時(shí)達(dá)到接近典型TTN翻譯的翻譯等位基因比率(圖3H)界斜。其余5名TTNtv攜帶者也沒(méi)有表現(xiàn)出NMD,這表明兩個(gè)等位基因都是翻譯的合冀,但我們?cè)陔s合變異位置缺乏足夠的Ribo-Seq覆蓋率來(lái)區(qū)分突變和未突變的等位基因各薇。
無(wú)義TTNtvs下游的翻譯可能是由于終止密碼子抑制造成的,因?yàn)槲覀冇^察到核糖體在翻譯過(guò)程中通過(guò)這些停止密碼子而沒(méi)有被釋放(圖S3J)君躺。相反峭判,TTNtvs移碼突變下游的翻譯可能是由于IRESs的重新啟動(dòng)或及時(shí)的核糖體移動(dòng)回到主要的TTN ORF开缎。為了測(cè)試TTNtv下游的翻譯是否可以導(dǎo)致穩(wěn)定的TTN的產(chǎn)生,我們對(duì)兩個(gè)大鼠模型的心肌蛋白質(zhì)組進(jìn)行了分析朝抖,這兩個(gè)模型在大鼠Ttn Z-disc(TtntvZ)或A帶(TtntvA)中攜帶了人工的雜合移碼(Scha?fer et al., 2017a)啥箭。為了獲得等位基因特異的蛋白質(zhì)組數(shù)據(jù)谍珊,我們使用了來(lái)自突變型Ttn F344大鼠和野生型Ttn Brown挪威(BN)大鼠的F1雜交治宣。TtntwZ等位基因在Ttntv下游顯示出一致的翻譯信號(hào)(Schafer et al., 2017a; Figure 3I),并且一致地砌滞,我們檢測(cè)到Ttntv下游的TtntwZ等位基因特有的讀碼框內(nèi)肽的產(chǎn)生(圖3J)侮邀。相反,TtntwA動(dòng)物沒(méi)有表現(xiàn)出任何針對(duì)突變等位基因的N-末端或C-末端多肽贝润。
我們的數(shù)據(jù)說(shuō)明了TTN生成的廣泛平移調(diào)控(圖S3K-S3N)绊茧。并不是所有的TTNtvs都能有效地終止翻譯,而且這些翻譯模式的比率在不同的突變和個(gè)體之間是不同的打掘,這增加了這些TTNtv對(duì)心臟功能的影響华畏。
lncRNAs在人心臟、肝臟和腎臟中的廣泛翻譯
從前非編碼RNA翻譯的微蛋白經(jīng)常被忽視尊蚁,它們?cè)谌祟惤M織中的流行亡笑、調(diào)節(jié)和可能的功能在很大程度上仍不清楚(Makarewich and Olson, 2017)。為了發(fā)現(xiàn)心臟微蛋白横朋,我們?cè)谛呐KlncRNA中尋找翻譯的sORF仑乌。在783個(gè)轉(zhuǎn)錄的lncRNA中,169個(gè)(22%)被翻譯成潛在的微蛋白琴锭,中位長(zhǎng)度為49aa(圖4A晰甚;表S5)。我們?cè)谠呐K成纖維細(xì)胞(Cho?thani et al., 2018)和誘導(dǎo)的多能干細(xì)胞來(lái)源的心肌細(xì)胞(IPSC-CMS)的翻譯體中驗(yàn)證了這些翻譯事件决帖。準(zhǔn)確檢測(cè)到已知的心臟微蛋白(199個(gè)中的190個(gè)厕九;95%),包括最近發(fā)現(xiàn)的DWORF(Nelson et al., 2016)地回、SPAR(Matsumoto et al., 2017)和ALN(也稱為C4orf3)(Anderson et al., 2016a)扁远。與DWORF相似,169個(gè)翻譯的lncRNAs中有16個(gè)在心臟或骨骼肌組織中特異表達(dá)(表S5)落君,表明具有肌肉特異性功能穿香。為了驗(yàn)證已鑒定的sORF的翻譯潛力,我們對(duì)58個(gè)隨機(jī)選擇的人類lncRNAs的完整轉(zhuǎn)錄本進(jìn)行了體外翻譯(IVT)測(cè)試绎速,成功地為其中44個(gè)(75%皮获;圖4B;圖S4A和S4B纹冤;表S5)生成了微蛋白洒宝。隨后的起始密碼子突變阻止了翻譯购公,并導(dǎo)致預(yù)測(cè)大小范圍內(nèi)的信號(hào)丟失(圖4B;圖S4A)雁歌。
大多數(shù)翻譯的lncRNAs(>90%)的表達(dá)不局限于心臟宏浩。事實(shí)上,122個(gè)在至少10個(gè)其他組織中表達(dá)靠瞎,44個(gè)在GTEx項(xiàng)目中的所有組織中表達(dá)(GTEx Consortium比庄,2017)。為了研究這種翻譯是否也發(fā)生在其他組織中乏盐,我們檢測(cè)了6個(gè)人肝和6個(gè)人腎組織的翻譯體佳窑。在檢測(cè)到的169個(gè)在人心臟中翻譯的lncRNAs中,71個(gè)(42%)和116個(gè)(69%)分別在肝臟和腎臟表達(dá)父能。
其中神凑,56個(gè)(肝臟)和87個(gè)(腎臟)被主動(dòng)翻譯,所有3個(gè)組織中共有50個(gè)lncRNA被翻譯(圖S4C)何吝。重要的是溉委,對(duì)于大多數(shù)(85%-91%),至少有1個(gè)sORF與在心臟中檢測(cè)到的sORF相同爱榕。根據(jù)sORFs.org數(shù)據(jù)庫(kù)(Olexiouk et al., 2018)瓣喊,之前已經(jīng)在51個(gè)翻譯的lncRNA中檢測(cè)到72個(gè)sORF在人類細(xì)胞系中翻譯。我們的數(shù)據(jù)證實(shí)了這些sORF在人體組織中的翻譯呆细,并進(jìn)一步強(qiáng)調(diào)了在118個(gè)lncRNA中先前未檢測(cè)到的272個(gè)sORF的翻譯型宝。
與之前在人類細(xì)胞系中的觀察結(jié)果(Bazzini et al., 2014; Calviello et al., 2016)一致,我們?cè)诩棺祫?dòng)物中只檢測(cè)到少數(shù)具有很強(qiáng)aa保守性的sORFs(在12個(gè)lncRNA中有17個(gè)sORF)(Lin et al., 2011; Mackowiak et al., 2015)絮爷。然而趴酣,許多l(xiāng)ncRNA可以與其他人類物種(黑猩猩、大猩猩和猩猩坑夯;n=79)的基因組或其他靈長(zhǎng)類或哺乳動(dòng)物的基因組(分別為31或43)配對(duì)岖寞,只有16個(gè)完全為人類所特有(表S5)。在大鼠和小鼠心臟中柜蜈,我們發(fā)現(xiàn)具有與mRNA相似的TEs的可比的lncRNA翻譯率(13%-22%仗谆;圖4C;表S5)(圖4D淑履;圖S4D)隶垮。盡管氨基酸保守性有限,169個(gè)人類翻譯的lncRNA中有76個(gè)對(duì)嚙齒動(dòng)物是位置保守的秘噪,即它們位于同源蛋白編碼基因的兩側(cè)狸吞,具有相同的相對(duì)取向(Ulitsky,2016),其中18個(gè)在嚙齒動(dòng)物中也被翻譯蹋偏,7個(gè)具有相同的翻譯起始位點(diǎn)(表S5)便斥。
人體心臟中微量蛋白質(zhì)的在體檢測(cè)
體內(nèi)微蛋白檢測(cè)是具有挑戰(zhàn)性的,并且使用定制搜索數(shù)據(jù)庫(kù)在深度MS數(shù)據(jù)集中搜索可能導(dǎo)致假陽(yáng)性肽鑒定(Ba′ nfai et al., 2012; Baz?zini et al., 2014; Low et al., 2013; Mackowiak et al., 2015; Nes?vizhskii, 2014; Omenn et al., 2017; Slavoff et al., 2013)威始。搜索極深度的人類心臟獵槍MS數(shù)據(jù)(Doll et al., 2017) 和新產(chǎn)生的人iPSC-CMs的深度蛋白質(zhì)組學(xué)數(shù)據(jù)枢纠,我們從339個(gè)sORF中檢測(cè)到140個(gè)翻譯的微蛋白的獨(dú)特肽證據(jù),這些微蛋白由169個(gè)翻譯的lncRNAs中的93個(gè)所編碼(表S5)黎棠。對(duì)于28個(gè)微蛋白晋渺,我們檢測(cè)到超過(guò)1個(gè)唯一的微肽,在超過(guò)1個(gè)樣本中檢測(cè)到100個(gè)微蛋白(表S5)葫掉。為了定義這些搜索的假陽(yáng)性率些举,我們采用了目標(biāo)誘餌策略跟狱,隨后進(jìn)行了統(tǒng)計(jì)二次抽樣分析俭厚,除了MaxQuant中已經(jīng)實(shí)施的反向命中目標(biāo)誘餌策略 (Cox and Mann, 2008; Elias and Gygi, 2010; STAR Methods)外,還執(zhí)行了該策略驶臊。雖然我們觀察到真正的微蛋白比人造微蛋白有明顯的富集(empirical p < 0.001; effect size, 5.99– 7.57挪挤;圖S4E),但仍然可以檢測(cè)到假陽(yáng)性多肽关翎,反映顯著的FDR值為±50%-60%扛门。為此,我們接下來(lái)設(shè)計(jì)了一種高通量選擇性反應(yīng)監(jiān)測(cè)(SRM)試驗(yàn)(Picotti et al., 2010)纵寝。SRM是一種高度靈敏的靶向MS方法论寨,它使用合成的標(biāo)志肽來(lái)檢測(cè)前體到片段離子的準(zhǔn)確碎片模式(‘‘transitions’’),從而提高了微蛋白檢測(cè)的靈敏度和特異性爽茴。在5個(gè)人的心臟中(每個(gè)2個(gè)技術(shù)重復(fù))葬凳,我們從83個(gè)lncRNAs中的50個(gè)(60.2%)翻譯過(guò)來(lái),我們從隨機(jī)選擇的137個(gè)微蛋白中確定了76個(gè)(55.4%)(表S5)室奏。這些結(jié)果證實(shí)了許多翻譯的sORFs產(chǎn)生可在體內(nèi)檢測(cè)到的微蛋白火焰,但也說(shuō)明了使用一系列獨(dú)立的方法(跨樣本的Ribo-Seq、IVT分析胧沫、鳥(niǎo)槍MS和SRM)來(lái)提供對(duì)微蛋白發(fā)現(xiàn)的信心是至關(guān)重要的昌简。
微蛋白/微肽是由具有已知功能的“非編碼”RNA產(chǎn)生的
在改進(jìn)的轉(zhuǎn)錄本注釋(例如,圖4E)的幫助下绒怨,我們?cè)?7個(gè)人和5個(gè)小鼠LncRNA中鑒定了翻譯后的sORF纯赎,其中具有先前分配的非編碼功能,包括LINCPINT(也稱為lincRNA-Mkln1) (Huarte et al., 2010)南蹂、JPX(Tian et al., 2010)犬金、CRNDE(Graham et al., 2011)、NEAT1(Clemson et al., 2009)、DANCR(Kretz et al., 2012)佑附、CRNDE(Graham等人樊诺,2011年)、NEAT1(Clemson等人音同,2009年)词爬、DANCR(Kretz等人,2010年)和 GATA6-AS1 (也稱為 lncGATA6) (Zhu et al., 2018)权均。此外顿膨,我們?cè)谂c心臟功能相關(guān)的lncRNAs myheart (Han et al., 2014)、chaer (Wang et al., 2016), UPPERHAND (也稱為UPH or HAND2-AS1; Anderson et al., 2016b), ZFAS1 (Zhang et al., 2018b)叽赊、和 TRDN-AS (也稱為RP11-532N4.2; Zhang et al., 2018a) (圖4F; 圖S4F; 表S6)中檢測(cè)到已翻譯的sORF恋沃。在上述的lncRNAs中,NEAT1必指、GATA6-AS1和上手基因在人和嚙齒動(dòng)物的心臟中都是位置保守和可翻譯的囊咏,并且這些lncRNAs表達(dá)的微蛋白都可以在體內(nèi)檢測(cè)到(表S5)。在27個(gè)具有非編碼功能的人類lncRNA中塔橡,有22個(gè)也在人的腎臟和肝臟中被檢測(cè)到翻譯梅割,我們先前證明其中一些,包括DANCR葛家,在人類細(xì)胞系中位于細(xì)胞染色體上并與核糖體相關(guān)(van Heesch et al., 2014; Mukherjee et al., 2017)户辞。
在這些發(fā)現(xiàn)的推動(dòng)下,我們研究了其他具有已知胞漿定位和核糖體關(guān)聯(lián)的功能特征的lncRNAs(Cabili et al., 2015; van Heesch et al., 2014)癞谒,但沒(méi)有檢測(cè)到典型的AUG ORF底燎。我們?cè)谙惹板e(cuò)誤注釋的lncRNA TUG1的50個(gè)前導(dǎo)序列中檢測(cè)到一個(gè)高度保守的非規(guī)范翻譯起始密碼子(CUG)ORF(153aa;系統(tǒng)發(fā)育密碼子替換頻率[PhyloCSF]得分為350)(圖4G)弹砚。我們驗(yàn)證了TUG1在體外的翻譯(圖4H)双仍,并表明TUG1蛋白定位于細(xì)胞核和線粒體(圖4I)或這其中的任何一個(gè)(未展示數(shù)據(jù))。TUG1在人類和嚙齒動(dòng)物組織中普遍翻譯迅栅,TUG1的過(guò)度表達(dá)驅(qū)動(dòng)了基因表達(dá)的變化殊校,我們可以將其歸因于TUG1蛋白(圖S4G)。有趣的是读存,小鼠Tug1基因座的全基因切除會(huì)導(dǎo)致男性不育和中段缺陷为流,這突顯了Tug1基因座的重要性(Lewan?dowski et al., 2019)。
翻譯的lncRNAs在健康和疾病心臟中的表達(dá)調(diào)控
上述功能鑒定的幾個(gè)lncRNAs是基因組反義lncRNAs让簿,據(jù)報(bào)道參與相鄰蛋白編碼基因的順式調(diào)控(Anderson et al., 2016b; Han et al., 2014; Zhang et al., 2018a)敬察。我們發(fā)現(xiàn)18對(duì)顯著相關(guān)的正義-反義基因?qū)?Spearman’s rho, 0.52–0.76; ),涉及主要心臟轉(zhuǎn)錄因子(HAND2尔当、TBX5和GATA6)和心臟調(diào)節(jié)或結(jié)構(gòu)基因(Corin莲祸、TRDN和TNNI3)的反義翻譯lncRNA(圖S4H)蹂安。在翻譯過(guò)程中,除TRDN-TRDN-AS1 (Spearman’s rho, 0.23 versus 0.53; p = 0.0136)外锐帜,大多數(shù)對(duì)的共調(diào)控降低(圖S4I)田盈。TRDN-AS1最近被發(fā)現(xiàn)是心肌和骨骼肌triadin產(chǎn)生的順式調(diào)節(jié)因子(Zhang et al., 2018a),翻譯協(xié)同調(diào)節(jié)表明這兩種蛋白具有共同功能缴阎。在所有翻譯的lncRNA中允瞧,34個(gè)在病變心臟中上調(diào),7個(gè)下調(diào)(圖S4J和S4K蛮拔;表S2)述暂,這為進(jìn)一步研究這些微蛋白的潛在作用奠定了基礎(chǔ)。
微蛋白共定位線粒體及與線粒體相關(guān)生物過(guò)程
樣本之間的基因表達(dá)相關(guān)性可以表明功能協(xié)同調(diào)節(jié) (Saha et al., 2017)建炫。聚類全基因組的表達(dá)相關(guān)性畦韭,我們發(fā)現(xiàn)翻譯的lncRNA顯著富集(93/169;肛跌;Fisher‘s精確檢驗(yàn))艺配,在由核編碼的線粒體基因(基因本體學(xué)[GO]:0005739線粒體,)主導(dǎo)的簇中惋砂。參與氧化磷酸化(OXPHOS)的基因(京都基因和基因組百科全書(shū)[KEGG]:hsa00190妒挎,p=6.43 31040)(圖5A)與選擇翻譯的lncRNA(圖5B中突出顯示的前3個(gè))特別相關(guān)。
然后西饵,對(duì)于每個(gè)翻譯的lncRNA,我們編譯了所有共同調(diào)節(jié)的蛋白編碼基因(Spearman’s rho R 0.5)鳞芙,并搜索功能共性眷柔。我們將42個(gè)翻譯的lncRNA與不同的細(xì)胞過(guò)程相關(guān)聯(lián)(圖S5A),其中22個(gè)包括線粒體功能(圖5C)原朝。我們選擇了這22個(gè)微蛋白中的3個(gè)來(lái)演示特定的線粒體定位(圖5D)驯嘱。對(duì)于另外18個(gè)微蛋白,我們根據(jù)蛋白質(zhì)序列特征和/或表達(dá)共調(diào)控預(yù)測(cè)它們位于線粒體上(表S5)喳坠,我們也可以證實(shí)線粒體的定位(圖S5B)鞠评。這些包括從4個(gè)小核仁RNA(snoRNA)宿主基因(Gas5、SNHG6壕鹉、SNHG8和SNHG16)和從lncRNA JPX中uORF衍生的sORF翻譯的微蛋白(Hezroni et al., 2017)剃幌,進(jìn)一步確立了許多微蛋白似乎是線粒體定位的總趨勢(shì)。
一種線粒體微蛋白PDZRN3-AS1是一個(gè)47-aa預(yù)測(cè)的單程跨膜螺旋蛋白晾浴,我們通過(guò)3D建模證實(shí)了其螺旋結(jié)構(gòu)(圖6A)负乡。利用免疫共沉淀、(共)定位和蛋白酶K消化實(shí)驗(yàn)脊凰,我們證明PDZRN3-AS1與線粒體內(nèi)膜上的RMND1特異相互作用(圖6B-6E)抖棘,其中RMND1是翻譯氧化磷酸化OXPHOS亞基所必需的(Janer et al., 2015)。
此外,與線粒體過(guò)程不同的是切省,信號(hào)肽裂解位點(diǎn)預(yù)測(cè)表明最岗,并不是所有的微蛋白都留在細(xì)胞內(nèi)(圖S6A)。我們測(cè)試了兩個(gè)潛在的分泌微蛋白(RP11-432J24.5和AC093642.6)朝捆,確實(shí)發(fā)現(xiàn)了與分泌途徑的其他分泌蛋白和組件的相互作用(圖S6B)仑性。除了PDZRN3-AS1之外,還有多個(gè)其他微蛋白被預(yù)測(cè)具有跨膜螺旋右蹦,包括SOX9-AS1诊杆、BANCR(Flockhart et al., 2012)和UPPERHAND(Anderson et al., 2016b)(圖S6C;表S5)何陆〕啃冢基因表達(dá)的共同調(diào)控意味著內(nèi)質(zhì)網(wǎng)(ER)的上端作為一個(gè)完整的膜組件(圖S6D)。事實(shí)上贷盲,上手定位于內(nèi)質(zhì)網(wǎng)(圖S6E)淘这,在那里它幾乎只與膜蛋白相互作用(圖S6F)。值得注意的是巩剖,在轉(zhuǎn)化生長(zhǎng)因子b1(TGF-b1)刺激下铝穷,原代心臟成纖維細(xì)胞中上位的lncRNA表達(dá)強(qiáng)烈下調(diào)(Chothani et al., 2018),表現(xiàn)出與促纖維化細(xì)胞因子白細(xì)胞介素11(IL-11)相反的表達(dá)調(diào)控(圖S6G佳魔;Schafer et al., 2017b)曙聂。小干擾RNA(siRNA)介導(dǎo)的上游LncRNA的敲除和內(nèi)源性上游AUG的突變均導(dǎo)致纖維化標(biāo)志物基因表達(dá)增加(圖S6H和S6I)。上手的潛在抗纖維化作用的機(jī)制基礎(chǔ)需要進(jìn)一步建立鞠鲜,但可能通過(guò)與TGF-β1的直接相互作用(Miao et al., 2019)或通過(guò)緩解內(nèi)質(zhì)網(wǎng)應(yīng)激和未折疊蛋白反應(yīng)(已知的纖維化增強(qiáng)劑)來(lái)介導(dǎo)(Heindryckx et al., 2016; Tanjore et al., 2013)宁脊。
人類心臟環(huán)狀RNA的翻譯
除了lncRNAs外,CircRNAs是另一類有潛力被翻譯的非編碼RNA(Legnini et al., 2017; Pamudurti et al., 2017; Yang et al., 2017)贤姆。我們?cè)?,181個(gè)基因中檢測(cè)到8,878個(gè)人類心臟circRNA(表S7榆苞;圖S7A-S7C),其中2,070個(gè)以前沒(méi)有檢測(cè)到(表S7)(Gla?zar et al., 2014; Khan et al., 2016)霞捡。值得注意的是坐漏,我們檢測(cè)到了39個(gè)基因產(chǎn)生的40個(gè)circRNA的核糖體結(jié)合,從而可能有蛋白質(zhì)翻譯(圖7A碧信;表S7)赊琳。這些circRNA主要存在于CircBase中(85%;圖7B)(Glazar et al., 2014)音婶,并顯示對(duì)RNaseR的耐藥性增加(圖S7D慨畸;表S7)。為了確保CircRNA反向剪接接頭上的Riboseq讀數(shù)的特定比對(duì)衣式,我們將Ribo-Seq數(shù)據(jù)與匹配的模擬反向剪接接頭集進(jìn)行了比對(duì)寸士,以表明CircRNA-核糖體關(guān)聯(lián)不是偶然出現(xiàn)的(調(diào)整后的p值)(圖7C)檐什。新檢測(cè)到的核糖體相關(guān)circRNA的例子包括高占有率的circCFLAR(圖7D)和心臟特異的circRNAs circSLC8A1(圖7E)、circMYBPC3和circRYR2弱卡。此外乃正,其中一個(gè)與核糖體相關(guān)的circRNA是microRNA海綿circCDR1-AS,另外5個(gè)先前已被報(bào)道在人類細(xì)胞中翻譯(Yang et al., 2017)婶博。重要的是瓮具,我們?cè)讷C槍MS數(shù)據(jù)中檢測(cè)到40個(gè)CircRNA中6個(gè)的翻譯后剪接接頭的體內(nèi)肽證據(jù)診斷(圖7F;表S7)凡人。雖然這表明已識(shí)別的核糖體相關(guān)的心臟circRNA可以產(chǎn)生可檢測(cè)到的肽名党,但需要進(jìn)一步檢測(cè)和靶向策略來(lái)確認(rèn)它們的識(shí)別并建立潛在的功能作用。
討論
人體組織中空間轉(zhuǎn)錄和翻譯調(diào)控
翻譯調(diào)控在塑造人類心臟基因表達(dá)方面具有顯著的過(guò)程和途徑特異性作用挠轴。我們特別強(qiáng)調(diào)了mTOR信號(hào)在終末期心臟擴(kuò)張中的作用传睹,以前曾被認(rèn)為是遺傳性心肌病小鼠模型中心臟翻譯的全局調(diào)節(jié)因子(Sciarretta et al., 2018),但僅在人類中偶然發(fā)生(Yano et al., 2016)岸晦。此外欧啤,我們還發(fā)現(xiàn)uORF和初級(jí)ORF翻譯率通常不是反相關(guān)的,這一觀察結(jié)果在酵母启上、果蠅和哺乳動(dòng)物細(xì)胞中得到了類似的正相關(guān)(Aspden et al., 2014; Brar et al., 2012; Chew et al., 2016)邢隧。uORF肽有可能直接干擾翻譯機(jī)制,起到結(jié)構(gòu)性障礙的作用(Lovett and Rogers, 1996)冈在,從而減少了對(duì)數(shù)量依賴性的需要倒慧。盡管序列保守有限(1,090個(gè)uORF中只有23個(gè)顯示AA保守[Lin et al., 2011]),但我們?cè)谒衭ORF中檢測(cè)到29%的獨(dú)特肽(1,090個(gè)uORF中有316個(gè)讥邻;表S3)(Doll et al., 2017)迫靖,這表明結(jié)構(gòu)或調(diào)節(jié)功能對(duì)序列的依賴性較低。
PTVs通常不截?cái)嗟鞍踪|(zhì)
本研究表明兴使,遺傳變異可以影響人類組織中的翻譯過(guò)程,許多攜帶PTVs的mRNA逃避NMD并不充分地終止翻譯-這兩個(gè)密切相關(guān)的過(guò)程(Keeling et al., 2004)照激。重要的是发魄,主動(dòng)翻譯的核糖體在每個(gè)PTV前后顯示出相同的框內(nèi)密碼子移動(dòng),這表明只有初級(jí)閱讀框架被翻譯俩垃,下游核糖體的結(jié)合不是隨機(jī)的励幼。PTV和常規(guī)終止密碼子之間的結(jié)構(gòu)差異可以解釋為什么PTV的翻譯終止效率較低(Amrani et al., 2004; Loughran et al., 2014; Peix?eiro et al., 2012; Raimondeau et al., 2018),盡管通讀也發(fā)生在常規(guī)終止密碼子上(Dunn et al., 2013)口柳。盡管進(jìn)行了大量的嘗試苹粟,但我們沒(méi)有發(fā)現(xiàn)任何可以促進(jìn)終止密碼子抑制或IRES介導(dǎo)的翻譯重新啟動(dòng)的基序或序列。
有效的翻譯終止或重新啟動(dòng)可能會(huì)導(dǎo)致截短蛋白的產(chǎn)生跃闹,這可能會(huì)產(chǎn)生有益的或有害的生理后果嵌削。最近毛好,位于DMD截?cái)嗤蛔兿掠蔚腄MD基因的IRES已被證明能產(chǎn)生高功能的N末端截短的抗肌營(yíng)養(yǎng)不良蛋白,從而減輕營(yíng)養(yǎng)不良癥(Wein et al.,2014)苛秕。同樣肌访,缺少N端Z盤(pán)和大部分TTN I-帶的TTN亞型可能能夠挽救TTN的部分功能 (Deo, 2016; Zou et al., 2015)。相反艇劫,N-末端截短蛋白的產(chǎn)生可能具有有害(顯性-負(fù))效應(yīng)吼驶,正如先前對(duì)C-末端截短的TTN(Herman et al., 2012)和心肌肌鈣蛋白T(Watkins et al., 1996)提出的那樣。
以前未識(shí)別的轉(zhuǎn)錄本異構(gòu)體也可能導(dǎo)致明顯的翻譯或重新啟動(dòng)店煞。最近發(fā)現(xiàn)的TTN Cronos轉(zhuǎn)錄本(Zou et al., 2015)理論上可能有助于下游核糖體在4個(gè)TTNtv等位基因中的2個(gè)占據(jù)(表S4)蟹演。然而,Cronos似乎在成人心臟中低表達(dá)顷蟀,并且在Cronos開(kāi)始之前酒请,已經(jīng)可以在人(圖3H)和大鼠心臟(圖3I)中檢測(cè)到Ribo-Seq數(shù)據(jù)中的雜合位置选脊。
應(yīng)該注意的是锐涯,所有13名患有TTNtv的DCM患者都是終末期心力衰竭患者,我們不能確定是否有任何翻譯信號(hào)有助于疾病進(jìn)展或嚴(yán)重程度的改變贺纲,因?yàn)樗鼈兪腔仡櫺匝芯渴占拿取N覀冋J(rèn)為苟弛,在其他因素中,TTN翻譯動(dòng)態(tài)可能有助于TTNtv在遺傳DCM和普通人群中的可變表達(dá)率阁将,未來(lái)有必要對(duì)在普通人群中頻繁出現(xiàn)的表型沉默的TTNtv攜帶者進(jìn)行研究(Schafer et al., 2017a)膏秫,以評(píng)估這種不同的翻譯活動(dòng)在突變的TTN等位基因上的全部范圍和后果。
心臟lncRNA產(chǎn)生體內(nèi)可檢測(cè)到的微蛋白
在這項(xiàng)研究中做盅,我們?cè)敿?xì)介紹了以前在人類組織中未檢測(cè)到的微蛋白的發(fā)現(xiàn)缤削、驗(yàn)證和表征pipeline,我們發(fā)現(xiàn)這些微蛋白廣泛存在于人類的心臟吹榴、肝臟和腎臟中亭敢。與前人的一些報(bào)道(reviewed in Makarewich and Olson, 2017)不同,我們體內(nèi)微蛋白檢測(cè)pipeline的功能獨(dú)立于序列保守图筹,擴(kuò)展了我們和其他人之前開(kāi)發(fā)的檢測(cè)方法(Bazzini et al., 2014; Calviello et al., 2016; Macko?wiak et al., 2015)帅刀。這是一個(gè)重要的考慮因素,因?yàn)橛邢薜谋J夭⒉慌懦a(chǎn)功能性微蛋白远剩。相反扣溺,保守程度較低的蛋白可能代表進(jìn)化上年輕的基因(Ruiz-Orera等人,2018年)瓜晤,并提供了對(duì)最近進(jìn)化的人類或靈長(zhǎng)類特異蛋白的洞察力锥余。
采用實(shí)驗(yàn)和計(jì)算分析,我們發(fā)現(xiàn)許多微蛋白在靈長(zhǎng)類動(dòng)物中是保守的痢掠,并可以與線粒體相連驱犹,線粒體是一種功能相關(guān)的微蛋白已被描述(Makare?wich et al., 2018; Rathore et al., 2018; Stein et al., 2018)嘲恍。我們發(fā)現(xiàn)與OXPHOS亞基有特別強(qiáng)的微蛋白表達(dá)協(xié)同調(diào)節(jié),包括多個(gè)小輔助蛋白着绷,也被稱為額外的OXPHOS蛋白(Zicker?mann et al., 2010)蛔钙。有趣的是,這些輔助蛋白在進(jìn)化上是動(dòng)態(tài)的荠医,在真核生物中顯示出可變的保守性(Elurbe and Huynen, 2016)吁脱,這增加了一些新發(fā)現(xiàn)的微蛋白可能具有類似功能的可能性。我們的結(jié)果將線粒體定位為最近進(jìn)化的小蛋白子集的潛在進(jìn)化游樂(lè)場(chǎng)彬向,要么受到未知的定位信號(hào)或輸入系統(tǒng)的促進(jìn)兼贡,要么純粹由微蛋白大小或(帶正電的)aa組成驅(qū)動(dòng)(Couso and Patraquim, 2017)。例如娃胆,線粒體進(jìn)口和折疊蛋白CHCHD4(也稱為Mia40)可能介導(dǎo)微蛋白進(jìn)口遍希,因?yàn)樗@示出強(qiáng)烈傾向于具有通過(guò)平行二硫鍵連接的簡(jiǎn)單螺旋-環(huán)-螺旋結(jié)構(gòu)的低分子量底物(Backes and Herrmann, 2017; Banci et al., 2009)。
值得注意的是里烦,從具有良好特征的在健康和疾病中具有非編碼作用的lncRNAs翻譯而來(lái)的多個(gè)微蛋白凿蒜,這些lncRNAs的編碼潛力是未知的,并且改進(jìn)的轉(zhuǎn)錄注釋有助于檢測(cè)以前沒(méi)有注意到的sORF(例如胁黑,BANCR和TUG1)(圖4E和4G)废封。位置保守、翻譯和功能鑒定的lncRNA的一個(gè)突出例子是占優(yōu)勢(shì)的丧蘸。在小鼠中漂洋,已經(jīng)證明upperhand轉(zhuǎn)錄,而不是轉(zhuǎn)錄產(chǎn)物本身力喷,調(diào)節(jié)順式體內(nèi)的Hand2(Ander?son et al., 2016b)刽漂,并且發(fā)現(xiàn)成熟的upperhand轉(zhuǎn)錄產(chǎn)物主要定位于細(xì)胞槳,沒(méi)有明確的功能(Anderson et al., 2016b; Kopp and Mendell, 2018)弟孟。我們鑒定了高達(dá)134aa的上手蛋白亞型(圖S4F贝咙;表S5),包括預(yù)測(cè)的一種單程跨膜微蛋白拂募。重要的是颈畸,我的心臟(Han et al., 2014)和Chaer(Wang et al., 2016)的mRNA表達(dá)和翻譯,盡管先前聲稱對(duì)人類具有保守性没讲,但只能在嚙齒動(dòng)物心臟中檢測(cè)到(表S6)。
我們發(fā)現(xiàn)許多翻譯后的lncRNA可能同時(shí)具有編碼和非編碼作用礁苗。這種雙重角色以前曾被提出(Rinn and Chang, 2012)爬凑,已知存在于幾個(gè)mRNAs(Jenny et al., 2006; Leygue, 2007)和lncRNAs(Anderson et al., 2015; Yu et al., 2017)。顯然试伙,基于ORF長(zhǎng)度和序列保守性等標(biāo)準(zhǔn)將基因分類為編碼或非編碼類別將受益于基于例如RNA代謝譜的替代方法(Mukherjee et al., 2017)嘁信。雖然雙重作用使正確剖析任何基因的機(jī)制功能變得復(fù)雜于样,但這種多功能性很可能形成更真實(shí)的生物復(fù)雜性的表示,為探索這些微蛋白與人類健康和疾病的相關(guān)性創(chuàng)造了機(jī)會(huì)潘靖。
CONTACT FOR REAGENT AND RESOURCE SHARING
Further information and requests for resources and reagents should be directed to and will be fulfilled by the Lead Contact, Norbert
Hubner (nhuebner@mdc-berlin.de).
DATA AND SOFTWARE AVAILABILITY
The accession number for the identifiable human sequencing data reported in this paper is European Genome-phenome Archive (EGA): EGAS00001003263. The accession number for the non-identifiable human sequencing data and rodent left-ventricle sequencing data reported in this paper is European Nucleotide Archive (ENA): PRJEB29208. The accession number for the mass spectrometry proteomics data reported in this paper is ProteomeXchange Consortium (via the PRIDE partner repository [Perez-Riv?erol et al., 2019]): PXD012593. All code used for the analyses in this paper is available upon request.
ADDITIONAL RESOURCES
To make our data easily accessible, we built an interactive app that allows users to query all sequencing data (http://shiny.mdc-berlin.de/cardiac-translatome/). It enables the user to browse and visualize differential expression results, human cardiac microproteins and genetic associations presented in the paper. Additionally, fully prepared sessions for exploring the sequencing data and de?tected ORFs with the Integrated Genomics Viewer (IGV) are provided, as well as a custom FASTA database for proteomics searches.