人類轉(zhuǎn)錄因子-轉(zhuǎn)載

轉(zhuǎn)自iProteome,作者:項杭享怀,> 原文鏈接iProteome
翻譯自2018年 CELL文章The Human Transcription Factors
英文原文 The Human Transcription Factors

轉(zhuǎn)錄因子(Transcription Factors, TFs)是指能夠以序列特異性方式結(jié)合DNA并且調(diào)節(jié)轉(zhuǎn)錄的蛋白質(zhì)漓库。轉(zhuǎn)錄因子通過識別特定的DNA序列來控制染色質(zhì)和轉(zhuǎn)錄恃慧,以形成指導基因組表達的復雜系統(tǒng)。盡管眾多科學家對理解轉(zhuǎn)錄因子如何控制基因表達有著濃厚的興趣米苹,精準定位轉(zhuǎn)錄因子在基因組上的特異性結(jié)合位點糕伐,以及轉(zhuǎn)錄因子結(jié)合后最終如何參與轉(zhuǎn)錄調(diào)節(jié)仍然具有挑戰(zhàn)性。

本綜述主要涵蓋了1600多種可能的人類轉(zhuǎn)錄因子和與其中三分之二轉(zhuǎn)錄因子結(jié)合的motif蘸嘶,來鑒定轉(zhuǎn)錄因子并對其功能進行注釋良瞧。本文根據(jù)目前對轉(zhuǎn)錄因子及其功能的理解陪汽,為思考轉(zhuǎn)錄因子如何單獨又如何作為整體工作提供了思路。

01 什么是轉(zhuǎn)錄因子

轉(zhuǎn)錄因子是對基因組的直接闡釋褥蚯,是執(zhí)行DNA解碼序列的第一步挚冤。許多轉(zhuǎn)錄因子充當著主調(diào)節(jié)因子和選擇基因的角色,控制著細胞類型的決定赞庶、發(fā)育模式和特定途徑控制(如免疫反應)的過程训挡。在實驗中,轉(zhuǎn)錄因子可以促進細胞分化歧强、去分化和轉(zhuǎn)分化澜薄。轉(zhuǎn)錄因子和轉(zhuǎn)錄因子結(jié)合位點突變是人類致病的主要因素。在后生動物中摊册,他們蛋白質(zhì)序列調(diào)控區(qū)的生理作用通常非常保守肤京,這表明基因組調(diào)控"網(wǎng)絡"可能同樣是保守的。但是茅特,個別監(jiān)管序列的轉(zhuǎn)換率很高忘分,當時間尺度更長時,轉(zhuǎn)錄因子可能會發(fā)生多拷貝和突變白修。相同的轉(zhuǎn)錄因子可以調(diào)節(jié)不同細胞類型中的不同基因(例如妒峦,乳腺和子宮內(nèi)膜細胞系中的ESR1),這表明即使在同一生物體內(nèi)轉(zhuǎn)錄因子的調(diào)節(jié)也是動態(tài)的兵睛。確定轉(zhuǎn)錄因子如何以不同方式組裝以識別綁定位點和調(diào)控"網(wǎng)絡"轉(zhuǎn)錄是一項龐大而令人望而生畏的工作肯骇,但是,對于理解它們的生理作用卤恳、解碼基因組的特定功能累盗,以及在復雜生物中繪制高度特異性表達程序的編排是至關(guān)重要的寒矿。

相對于其他序列突琳,轉(zhuǎn)錄因子對特異性結(jié)合序列具有1,000倍甚至更高的偏好,因為轉(zhuǎn)錄因子可以通過阻斷其他蛋白質(zhì)的DNA結(jié)合位點進而發(fā)揮作用(例如符相,經(jīng)典的lambda拆融,lac和trp 阻遏物),單獨結(jié)合特定DNA序列的能力通常被視為調(diào)節(jié)轉(zhuǎn)錄能力的指標啊终。如果沒有轉(zhuǎn)錄因子結(jié)合的DNA序列的詳細信息镜豹,就不能在功能上理解這些蛋白質(zhì)。轉(zhuǎn)錄因子與特異性DNA結(jié)合通常概括為“基序”(motif) 蓝牲,是指給定TF優(yōu)先的相關(guān)短序列組的模型趟脂,其可用于掃描較長序列(例如,啟動子)以鑒定潛在的結(jié)合位點例衍。確定DNA結(jié)合的motif通常是詳細闡釋轉(zhuǎn)錄因子功能的第一步昔期,鑒定潛在的結(jié)合位點為進一步分析提供了途徑已卸。在過去的十年中,我們開發(fā)motif和基因組結(jié)合位點的能力得到了顯著提高硼一,從而產(chǎn)生了關(guān)于TF-DNA相互作用的前所未有的大量數(shù)據(jù)累澡。為了開發(fā)目前的TF目錄,本文主要參考了TRANSFAC般贼,JASPAR愧哟,HT-SELEX,UniPROBE和CisBP哼蛆,以及先前的人類轉(zhuǎn)錄因子目錄蕊梧。

02 如何識別轉(zhuǎn)錄因子

最早在20世紀80年代,就描述了真核生物中的主要TF家族腮介,如C2H2-鋅指(ZF)望几,同源域,堿性螺旋 - 環(huán) - 螺旋(bHLH)萤厅,堿性亮氨酸拉鏈(bZIP)和核激素受體(NHR)橄抹。通常通過諸如DNA酶足跡法或遷移率變換的方法鑒定結(jié)合位點,再使用N-末端肽測序惕味,噬菌體文庫或單雜交篩選鑒定特定結(jié)合蛋白楼誓。繼續(xù)通過實驗方法鑒定(例如,單雜交測定名挥,DNA親和純化-質(zhì)譜疟羹,和蛋白質(zhì)微陣列可以篩選新的DNA結(jié)合蛋白),但是今天禀倔,大多數(shù)已知和推定的TF已經(jīng)通過先前表征的DNA結(jié)合結(jié)構(gòu)域(DBD)的序列同源性來鑒定榄融,這也用于對TF進行分類。目前在蛋白質(zhì)數(shù)據(jù)庫(PDB)中可獲得大約100種已知的真核生物DBD類型救湖。迄今為止愧杯,除了少數(shù)充分表征的哺乳動物轉(zhuǎn)錄因子之外的所有轉(zhuǎn)錄因子都含有已知的DBD。在僅基于與DBD的同源性匹配來推斷功能時必須小心鞋既,因為并非所有結(jié)構(gòu)域都一定會結(jié)合特定DNA序列力九。

03 如何確定TF-DNA結(jié)合的motif

首先根據(jù)結(jié)合位點中每個堿基的轉(zhuǎn)錄因子的相對偏好產(chǎn)生一張基礎表或“位置權(quán)重矩陣”(PWM)。在每個堿基位置邑闺,四個堿基中的每一個都具有得分跌前,并且將序列的每個堿基的這些得分相乘來預測得到轉(zhuǎn)錄因子對該序列的相對親和力。在許多情況下陡舅,這反映了對一個或少數(shù)相關(guān)序列的強烈偏好抵乓。此外,PWM還存在一些缺點:基線位置之間可能存在依賴關(guān)系由于DNA形狀或可變形性; 轉(zhuǎn)錄因子可以具有多種結(jié)合模式(例如,蛋白質(zhì)的不同物理構(gòu)型導致分離的灾炭,不同的基序)等章鲤。為了解釋這些復雜性,科學家們開發(fā)了更復雜的模型咆贬,例如結(jié)合了對二核苷酸和高級k-mers的偏好爷速,使得轉(zhuǎn)錄因子及其家族的準確性有所提高膏孟。然而,在許多情況下,改進的效果很小甚至檢測不到库糠。PWM仍然是分析轉(zhuǎn)錄因子結(jié)合最常用的模型钮追,并術(shù)語“motif”來表示PWM怒炸。

接下來通常通過實驗確定的結(jié)合位點和與motif匹配的序列之間僅存在部分重疊隅俘,甚至實驗確定的結(jié)合位點是相對較差的預測因子。同時酌儒,motif匹配通常是ChIP-seq(染色質(zhì)免疫沉淀測序)數(shù)據(jù)集中最富集的序列之一辜妓,表明內(nèi)在DNA結(jié)合的特異性對于體內(nèi)轉(zhuǎn)錄因子的結(jié)合是重要的。出現(xiàn)這樣的現(xiàn)象不是空穴來風忌怎,大多數(shù)轉(zhuǎn)錄因子結(jié)合位點很屑巍(通常是6-12個堿基),并且是靈活的榴啸,因此典型的人類基因(> 20 kb)將包含大多數(shù)轉(zhuǎn)錄因子的多個潛在結(jié)合位點孽惰。因此我們需要通過其它途徑來解決問題,例如轉(zhuǎn)錄因子之間的協(xié)同性和協(xié)同作用鸥印,為這種特異性缺陷提供了一個現(xiàn)成的解決方案勋功。大多數(shù)人類的轉(zhuǎn)錄因子必須共同努力才能完成任何事情,但是他們之間的相互作用和關(guān)系的細節(jié)大多數(shù)是未知的库说。結(jié)合DNA后轉(zhuǎn)錄因子的生物化學作用也在很大程度上未被反映出來狂鞋。因此,解碼基因調(diào)控如何與TF結(jié)合基序和基因序列相關(guān)仍然是一個主要的現(xiàn)實層面的挑戰(zhàn)潜的。

04 轉(zhuǎn)錄因子的協(xié)同性和與核小體的相互作用

理論論證和實踐觀察表明骚揍,后生動物的轉(zhuǎn)錄因子一般必須共同作用才能與DNA結(jié)合,在效應功能中達到所需的特異性夏块。轉(zhuǎn)錄因子有多種合作方式疏咐,例如幫助相互結(jié)合DNA(協(xié)同結(jié)合)或通過不同機制影響染色質(zhì)狀態(tài)或轉(zhuǎn)錄(協(xié)同調(diào)節(jié))。TF還可以作為同二聚體(例如脐供,bZIP和bHLH),三聚體(例如借跪,熱休克因子)或更高級結(jié)構(gòu)協(xié)同結(jié)合政己。

協(xié)同結(jié)合可以通過幾種方式發(fā)生。當它由蛋白質(zhì)-蛋白質(zhì)相互作用介導時最容易理解,當兩個(或更多個)相互作用蛋白質(zhì)以相容的間隔和方向結(jié)合DNA時歇由,便賦予其額外的穩(wěn)定性卵牍。高通量體外研究表明,協(xié)同結(jié)合常常影響復合物中轉(zhuǎn)錄因子的序列偏好沦泌,并且還可能對兩個結(jié)合位點之間的間隔序列產(chǎn)生限制糊昙。單分子成像的結(jié)果研究證實,當多個轉(zhuǎn)錄因子結(jié)合在一起時會占據(jù)更長時間谢谦。

最近的研究表明DNA介導的協(xié)同結(jié)合也在轉(zhuǎn)錄因子功能中起重要作用释牺。分子建模和結(jié)構(gòu)分析表明,在某些情況下回挽,協(xié)同性是由于DNA促進了蛋白質(zhì)之間的接觸没咙。在其他情況下,蛋白質(zhì)結(jié)合在DNA的對立面或彼此相對較遠的一邊千劈,表明DNA直接介導了協(xié)同性祭刚。也就是說,一個轉(zhuǎn)錄因子的結(jié)合以促進另一個轉(zhuǎn)錄因子結(jié)合的方式影響DNA的形狀墙牌。

為了與核小體DNA結(jié)合涡驮,TF必須與核小體競爭或以某種方式與核小體或核小體DNA相互作用以進入其位點。TF也可內(nèi)在地與核小體競爭結(jié)合TF喜滨,此外遮怜,一些TF可以啟動核小體的置換或至少改變它們的構(gòu)象。這些TF的活性也可能取決于它們結(jié)合核小體DNA的能力鸿市,這可能受核小體上結(jié)合位點的旋轉(zhuǎn)定位的影響(例如锯梁,Yamanaka因子 POU5F1,SOX2焰情,KLF4和MYC)陌凳。另一個有趣的現(xiàn)象是,不同的染色質(zhì)重塑器具有特定DNA序列和/或核小體構(gòu)象的偏好内舟,表明核小體和核小體的定位機制賦予了TF功能上額外的DNA序列特異性合敦。

05 轉(zhuǎn)錄因子效應器的功能

轉(zhuǎn)錄因子在與DNA結(jié)合時影響轉(zhuǎn)錄的方式變化很大。一些轉(zhuǎn)錄因子(例如验游,TBP)可以直接RNA招募聚合酶充岛,還有一些可以招募促進特定轉(zhuǎn)錄階段的輔助因子。大多數(shù)真核生物的轉(zhuǎn)錄因子被認為通過招募輔助因子起作用耕蝉。這種“共激活因子”和“輔阻遏物”最初被鑒定為轉(zhuǎn)錄因子效應子活性的介質(zhì)崔梗,通常是大的多亞基蛋白質(zhì)復合物,或通過幾種機制調(diào)節(jié)轉(zhuǎn)錄的多結(jié)構(gòu)域蛋白質(zhì)垒在。它們通常涉及染色質(zhì)結(jié)合蒜魄,核小體重塑和組蛋白或其他蛋白質(zhì)結(jié)構(gòu)域的共價修飾。IFNβ增強體是共激活因子招募的一個經(jīng)典例子,其中多個轉(zhuǎn)錄因子的結(jié)合導致GCN5 / KAT2A和 CBP / p300 組蛋白乙酰轉(zhuǎn)移酶的募集谈为。由此產(chǎn)生的局部染色質(zhì)環(huán)境變化會引起核小體重塑旅挤,如 SWI / SNF復合物為RNA聚合酶創(chuàng)造空間以結(jié)合并啟動轉(zhuǎn)錄。一些共激活因子和輔阻遏物似乎更廣泛伞鲫。p300經(jīng)常被用作增強子的標記物粘茄,與數(shù)十種TF相關(guān)聯(lián)。連接TF和RNA聚合酶II的Mediator復合物類似地與數(shù)千個基因座相關(guān)聯(lián)秕脓。

特異性的效應結(jié)構(gòu)域通称獍辏可以介導TF特異性輔助因子的招募。同樣撒会,核激素受體的配體結(jié)合結(jié)構(gòu)域以配體和背景依賴的方式促進與共激活因子嘹朗、輔阻遏物和其他TF的相互作用。經(jīng)大量研究后诵肛,發(fā)現(xiàn)蛋白質(zhì)中存在的經(jīng)典轉(zhuǎn)錄激活因子序列(例如屹培,TP53, E2F和SP1中發(fā)現(xiàn)的酸性序列)怔檩,它們通常是非結(jié)構(gòu)化的低復雜性序列褪秀,具有稱為短線性基序的小功能區(qū)域。

TF傳統(tǒng)上被歸類為“激活物”和 “阻遏物”; 然而許多TF根據(jù)所在序列的位置和輔助因子的作用可以招募具有相反作用的多種輔助因子薛训,例如媒吗,MAX作為與MNT或MXD1 作為異二聚體與DNA結(jié)合時起抑制劑作用,當作為異二聚體與MYC結(jié)合時起激活作用乙埃。目前還沒有全面的輔助因子目錄闸英。此外,基因激活或增強子和啟動子之間的通信所需的生化功能在很大程度上仍然是未知的介袜。人體中多達443種不同的染色質(zhì)修飾蛋白已經(jīng)做好了歸類甫何,并且已經(jīng)了解了輔助因子和染色質(zhì)蛋白之間的許多相互作用。但是遇伞,相同的研究檢測到很少的TF辙喂,這表明TF-輔助因子的相互作用是弱的/瞬時。

06 人類TF的合集

目前并沒有一個通用的解決方案可以自動生成我們所需要的列表鸠珠,因此當下結(jié)構(gòu)域無法精確地推測出轉(zhuǎn)錄因子巍耗,文庫又是高度不統(tǒng)一的,電子信息的注解有沒有一個統(tǒng)一的標準渐排。最新的人類轉(zhuǎn)錄因子庫發(fā)表于2009年炬太,總共涵蓋了535個人的轉(zhuǎn)錄因子,并描述了所推測的DBD飞盆。近年來娄琉,該文庫迅速擴展次乓。本綜述對人類轉(zhuǎn)錄因子集進行了一定程度的修訂吓歇。

本綜述手工查詢了2,765種蛋白質(zhì)孽水,為每種蛋白質(zhì)創(chuàng)建了一個網(wǎng)頁,其中包含所有相關(guān)信息和外部數(shù)據(jù)庫的鏈接城看。本綜述考慮了全局序列比對和DNA已知的結(jié)合的殘基女气,以便在僅有亞基結(jié)合DNA的家族(例如,ARID测柠,HMG和Myb / SANT)中對表征不佳的蛋白質(zhì)做一個評估炼鞠。考慮到可行性的因素轰胁,我們沒有搜索或記錄蛋白質(zhì)修飾或結(jié)合配偶體等復雜性谒主。 “HumanTFs”網(wǎng)站(http://humantfs.ccbr.utoronto.ca/)顯示結(jié)果,每個TF都有一個單獨的頁面赃阀,以及每種DBD類型的所有已知motif和信息以及序列比對霎肯。此網(wǎng)站還有一個用戶可以選擇提交其他信息的選項。

image

Table1. 判斷和識別TF特異性結(jié)合的實驗方法

最終記錄的1,639個已知或潛在的人類轉(zhuǎn)錄因子榛斯,其中大多數(shù)至少包含了兩種DBD類型中的一種(C2H2-ZFs和Homeodomains)观游。剩下近一半(46%)是另外六個bHLH 、bZIP 驮俗、Forkhead 懂缕、核激素受體、HMG / Sox 和ETS(圖1B)王凑。在考慮了缺乏DNA序列特異性的已知亞類后搪柑,含有Myb / SANT和HMG結(jié)構(gòu)域的TF比先前估計的少得多。1,639個TF中的絕大多數(shù)(93%)或作為單體與DNA結(jié)合或作為同源多聚體與DNA結(jié)合索烹。且許多都包含相同DBD類型的多拷貝(圖1C)工碾,但其中大多數(shù)是C2H2-ZF,它們與DNA按列結(jié)合(圖 1A)术荤。每種蛋白質(zhì)的C2H2-ZF數(shù)量變化很大倚喂,一定程度上取決于效應結(jié)構(gòu)域(圖1B )。含有KRAB的亞型中的大量C2H2-ZF可能是由于靶向單個轉(zhuǎn)座子所需的特異性瓣戚。只有一小部分TF(47或?3%)含有多種類型的DBD端圈,而POU是最常見的同源域是最常見的(圖1C )。大多數(shù)人類TF也含有其他蛋白質(zhì)結(jié)構(gòu)域(圖1D):其中有391種不同類型的非DNA結(jié)合結(jié)構(gòu)域子库,與TF效應子功能的多樣化和廣泛網(wǎng)絡的概念一致舱权。

當前的TF列表可能仍然不完整,完整的DBD系列可能仍然未被完全發(fā)掘仑嗅。實際上宴倍,由于缺乏規(guī)范的DBD张症,此列表中的69個TF被歸類為“unknown family”。大多數(shù)這些蛋白質(zhì)缺乏motif(見下文)鸵贬,晶體結(jié)構(gòu)基本上是無法獲得的俗他,并且與DNA結(jié)合的證據(jù)僅包括在單個文庫中鑒定的少數(shù)序列。因此阔逼,在獲得更多實驗數(shù)據(jù)結(jié)果前兆衅,應謹慎對待此類別的TF。

此外嗜浮,一些已知的DBD系列可能比目前所理解的更大羡亩。例如,根據(jù)Interpro和SMART數(shù)據(jù)庫危融,預測的簡單的AT鉤結(jié)構(gòu)域(由13個氨基酸[aa]共有序列表示)分別存在于3和21號人類基因中畏铆。然而,一個更寬泛的定義吉殃,只需要在22個堿基窗口上存在側(cè)翼為多個堿性殘基的GRP 三肽(Aravind和Landsman辞居,1998),它存在于數(shù)百種人類蛋白質(zhì)中寨腔,每種蛋白質(zhì)都可以代表真正的TF速侈。C2H2-ZF家族也值得評估,因為出現(xiàn)了更好的模型來識別這些短的(?23 aa)結(jié)構(gòu)域迫卢,并將參與DNA結(jié)合的那些區(qū)域與促進與RNA或其他蛋白質(zhì)相互作用的區(qū)域區(qū)分開來(Brayer和Segal倚搬,2008)。

image

Figure1. 人類轉(zhuǎn)錄因子合集

07 人類轉(zhuǎn)錄因子的序列特異性

目前大約四分之三(1,211)的人類轉(zhuǎn)錄因子具有與其結(jié)合的motif乾蛤。已知motif中的913個是通過體外高通量法(例如HT-SELEX或PBM)測定出來的每界。圖1B說明大多數(shù)類別的TF具有高或完全的motif覆蓋,而少數(shù)具有主要差異家卖。例如眨层,幾乎所有的同源結(jié)構(gòu)域(188/196)都有一個已知或推斷的motif,可能是由于它們相對容易在體外研究上荡,它們的深層次的特點能夠通過同源性推斷趴樱。相比之下,C2H2-ZF類轉(zhuǎn)錄因子目前缺少數(shù)百個motif(267/747)(圖1B)酪捡,可能是因為它們難以在體外研究(許多是大蛋白)叁征,而且保守的相對較少。

許多TF識別相似的motif逛薇,通常對應到TF家族或亞家族捺疼,這個現(xiàn)象與許多先前的研究一致(圖 2A)。值得注意的是永罚,C2H2-ZF蛋白為motif中最為多樣性的(圖2B)啤呼,這與先前所研究得結(jié)構(gòu)和DNA接觸殘基的多樣性一致卧秘。圖2C顯示的是NHR家族的motif,說明轉(zhuǎn)錄因子多樣性涉及單體DNA序列偏好和蛋白質(zhì)復合物形成的變化官扣。圖 2C中的許多motif被二聚體識別翅敌。在人體中總共有超過500個特異性的motif,表明廣泛的DNA序列可以作為轉(zhuǎn)錄因子結(jié)合位點醇锚。

image

Figure2. 特異性結(jié)合人類轉(zhuǎn)錄因子的DNA

08 人類轉(zhuǎn)錄因子的保護和進化

轉(zhuǎn)錄因子的演變通常比它們的調(diào)控位點的演變慢得多哼御。人和果蠅之間的轉(zhuǎn)錄因子直系同源物通常顯示出幾乎相同的序列特異性坯临。盡管如此焊唬,轉(zhuǎn)錄因子確實在不斷進化,它們的motif看靠、結(jié)合物和表達模式都在不停地改變著赶促。人類轉(zhuǎn)錄因子中不變與改變中的一個突出例子便是大多數(shù)哺乳動物基因組編碼了數(shù)百種含有KRAB的C2H2-ZF蛋白,其中許多都顯示出了多樣化選擇的標志挟炬,在人和小鼠之間也具有復雜的直系同源模式鸥滨。在人類中,KRAB C2H2-ZF蛋白通常都與轉(zhuǎn)座子(TEs)(主要是LINE和內(nèi)源性逆轉(zhuǎn)錄病毒)結(jié)合谤祖,在初期可能是通過抑制KRAB結(jié)構(gòu)域的功能使它們沉默婿滓。轉(zhuǎn)座子和轉(zhuǎn)錄因子之間的“軍事競賽”為其迅速而又多樣化的變化做出了很好的解釋。

基于它們在真核基因組中的分布(圖3A )粥喜,當前的1,639個轉(zhuǎn)錄因子根據(jù)親緣關(guān)系得知其涵蓋了包括脊椎動物凸主,四足動物,胎盤哺乳動物或靈長類動物在內(nèi)的后生動物主要群體额湘。有趣的是卿吐,幾乎所有脊椎動物都具有同源域蛋白的可識別對應物,而幾乎所有哺乳動物特異性蛋白都含有C2H2-ZF結(jié)構(gòu)域锋华。實際上嗡官,Ensembl定義的人類TF-TF旁系同源物之間的分化都有兩種趨向:兩側(cè)對稱動物中多種TFs家族出現(xiàn)了第一波重復,由KRAB C2H2-ZF主導的第二波重復則出現(xiàn)在Amniota(圖3B毯焕,左)衍腥。早期時整個多樣性的TF家族的復制與脊椎動物中整個基因組發(fā)生兩輪復制的假說一致。該事件與細胞類型的多元化發(fā)展是大致符合的纳猫,并且復制的TF可能有助于調(diào)控新細胞類型婆咸。KRAB的輻射性增加可能在一定程度上解釋了為什么胎盤能夠很大可能的傳遞逆轉(zhuǎn)錄病毒。值得注意的是续担,在過去的3億年里擅耽,KRAB的輻射區(qū)域中TF-TF的復制主導了其在所有人類同源物的分布(圖3B,右)物遇。

image

Figure3. 人類轉(zhuǎn)錄因子的直系同源基因和旁系同源基因

09 人類轉(zhuǎn)錄因子在組織和細胞類型中的表達

基因(包括轉(zhuǎn)錄因子)的組織和細胞類型包括TFs的特異性表達通常對應著相應的特定功能乖仇。我們使用來自人類組織圖譜中的RNA-seq數(shù)據(jù)檢查了在37個成人組織中的1,554個轉(zhuǎn)錄因子的表達模式(圖4A)憾儒,采用其組織特異性表達的定量定義。這種基因表達模式的全局視圖捕獲了許多特征明確的TF的已知作用乃沙。例如起趾,SOX2,OLIG1 和POU3F2(OCT7)幾乎只在大腦皮層中表達警儒,而GATA4和TBX20僅在心肌中高度表達训裆。該數(shù)據(jù)集中大約三分之一(543)的人類TF表現(xiàn)出組織特異性表達的特點,其中包括許多具有不良特征的生理作用蜀铲。

在其他的TF家族中边琉,一半(49%)是具有組織特異性的,并提供了關(guān)于其特定生理功能的線索记劝。更高分辨率的數(shù)據(jù)变姨,例如來自單細胞RNA-seq,可以解析同一組織的不同類型細胞對轉(zhuǎn)錄因子間的聯(lián)系厌丑,使得對于細胞鑒定和受轉(zhuǎn)錄因子調(diào)控的基因有更深刻的理解定欧。

10 遺傳學和疾病中的人類轉(zhuǎn)錄因子

轉(zhuǎn)錄因子占所有人類基因的約8%,并且與多種疾病和表型相關(guān)怒竿。轉(zhuǎn)錄因子突變通常是高度有害的砍鸠,這也解釋了為什么基因組TF編碼位點富含超保守的位點。轉(zhuǎn)錄因子遺傳分析可能因基因調(diào)控網(wǎng)絡固有的功能冗余而變得復雜耕驰,因為表型可能難以僅在特定條件下檢測得到或表現(xiàn)出來爷辱,或者因為在群體水平上具有高度有害作用的變體不存在。盡管如此耍属,關(guān)于臨床表型中人類TF的全球視角確實揭示了一個共同的主題托嚣。圖 4B展示出了編碼TF的基因內(nèi)或附近的大量突變相關(guān)的人類疾病表型。對于與先天性生長激素缺乏有關(guān)的垂體前葉發(fā)育不全觀察到了觀察到大量基因的富集厚骗。已知的15種基因參與該表型示启,其中有12種是編碼TF(p <10 -11 ),包括多個同源域和Sox家族的轉(zhuǎn)錄因子领舰》蛏ぃ總的來說,人313個(19.1%)的轉(zhuǎn)錄因子至少與一種表型相關(guān)冲秽,顯著高于所觀察到的部分(16.2%)舍咖。相比之下,基于最近的CRISPR篩選的數(shù)據(jù)(3%對10%)锉桑,轉(zhuǎn)錄因子從人類癌細胞系中的核心必需基因組中排除排霉,可能是因為人類的轉(zhuǎn)錄因子庫已主要用于發(fā)育或組織功能特定化。

一些多基因疾病的全基因組關(guān)聯(lián)研究(GWAS)信號也富集了基因座編碼的轉(zhuǎn)錄因子(圖4C)民轴。這些疾病中的很多都具有強烈的免疫依賴性攻柠,表明許多免疫反應相關(guān)的轉(zhuǎn)錄因子所具有的突出作用球订。此外,許多獨立的轉(zhuǎn)錄因子基因座具有針對多種疾病的強GWAS信號瑰钮。例如冒滩,編碼Ikaros基因家族C2H2-ZFS的基因座中,突變體IKZF1 和IKFZ3浪谴,在適應性免疫應答中起到了至關(guān)重要的作用开睡。

轉(zhuǎn)錄因子的模塊化結(jié)構(gòu)有助于突變影響的機制的識別。DBD突變會改變序列特異性苟耻,位于DBD之外的突變也可能對基因表達產(chǎn)生很大的影響篇恒。在癌癥中,染色體異沉撼剩可以產(chǎn)生具有新功能的癌融合蛋白婚度,例如Ets因子ERG和 FLI1 與RNA結(jié)合蛋白EWSR1融合。同樣的官卡,對于任何基因,在控制TF表達的調(diào)節(jié)區(qū)內(nèi)的突變醋虏,最終導致TF功能改變寻咒。例如,在驅(qū)動MYC 表達的增強子中弱化TCF7L2(TCF-4)結(jié)合位點可降低結(jié)腸中腫瘤發(fā)生的風險颈嚼。

轉(zhuǎn)錄因子作為一類獨特的基因毛秘,它們的結(jié)合位點會受所調(diào)節(jié)的DNA的變異或突變影響。目前發(fā)現(xiàn)了許多這樣的例子阻课,其中涵蓋了大量的的轉(zhuǎn)錄因子家族疾病叫挟。更深入地了解轉(zhuǎn)錄因子對于如何找到對應目標并控制基因表達模式對于我們了解85%-93%的常見疾病相關(guān)的遺傳變異有極大的幫助。

基因組中的大多數(shù)的功能性DNA都是具有調(diào)節(jié)性的限煞,轉(zhuǎn)錄因子在其的識別和功能發(fā)揮中起著核心作用抹恳。在許多人類疾病中TFs有著明顯的作用,使得理解轉(zhuǎn)錄因子所介導的基因調(diào)控機制的重要性更加突出署驻。目前所面臨的挑戰(zhàn)依然存在奋献,包括解決調(diào)節(jié)相同基因的多種元件之間的協(xié)同作用和冗余,預測增強子-啟動子的聯(lián)系旺上,沿染色體及其三維結(jié)構(gòu)上大規(guī)模調(diào)控的特點瓶蚂,以及各種類型的表觀遺傳記憶。解決這些挑戰(zhàn)的計算機方法是正在進行中宣吱,開發(fā)探索轉(zhuǎn)錄因子在成核和調(diào)停的實驗技術(shù)同樣也在進行著窃这。這些進展將有助于我們達到下一個人類遺傳學前沿:以TF的方式解碼基因組。

Origin: Lambert SA, Jolma A, Campitelli LF, Das PK, Yin Y, Albu M, Chen X, Taipale J, Hughes TR, Weirauch MT, The Human Transcription Factors.Cell 2018 Feb 08;172(4)
IF: 31.398 Cell 2018 Feb 08;172(4)DOI:10.1016/j.cell.2018.01.029

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末征候,一起剝皮案震驚了整個濱河市杭攻,隨后出現(xiàn)的幾起案子洒试,更是在濱河造成了極大的恐慌,老刑警劉巖朴上,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件垒棋,死亡現(xiàn)場離奇詭異,居然都是意外死亡痪宰,警方通過查閱死者的電腦和手機叼架,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來衣撬,“玉大人乖订,你說我怎么就攤上這事【吡罚” “怎么了乍构?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長扛点。 經(jīng)常有香客問我哥遮,道長,這世上最難降的妖魔是什么陵究? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任眠饮,我火速辦了婚禮,結(jié)果婚禮上铜邮,老公的妹妹穿的比我還像新娘仪召。我一直安慰自己,他們只是感情好松蒜,可當我...
    茶點故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布扔茅。 她就那樣靜靜地躺著,像睡著了一般秸苗。 火紅的嫁衣襯著肌膚如雪召娜。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天难述,我揣著相機與錄音萤晴,去河邊找鬼。 笑死胁后,一個胖子當著我的面吹牛店读,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播攀芯,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼屯断,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起殖演,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤氧秘,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后趴久,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體丸相,經(jīng)...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年彼棍,在試婚紗的時候發(fā)現(xiàn)自己被綠了灭忠。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡座硕,死狀恐怖弛作,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情华匾,我是刑警寧澤映琳,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站蜘拉,受9級特大地震影響萨西,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜诸尽,卻給世界環(huán)境...
    茶點故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一原杂、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧您机,春花似錦、人聲如沸年局。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽矢否。三九已至仲闽,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間僵朗,已是汗流浹背赖欣。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留验庙,地道東北人顶吮。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓,卻偏偏與公主長得像粪薛,于是被迫代替她去往敵國和親悴了。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,976評論 2 355

推薦閱讀更多精彩內(nèi)容