系統(tǒng)功能注釋和生物網(wǎng)絡(luò)可視化
Spatial Analysis of Functional Enrichment(SAFE)甩栈,功能富集空間分析
生物網(wǎng)絡(luò)代表genes間的關(guān)系,但我們對(duì)這種網(wǎng)絡(luò)功能組織的理解非常有限路捧。這里撒顿,我描述spatial analysis of functional enrichment(SAFE)丑罪,功能富集空間分析。SAFE在2D空間可視化網(wǎng)絡(luò)并且度量跨越本地鄰接功能富集的連續(xù)性分布,會(huì)產(chǎn)生相關(guān)聯(lián)的功能列表和他們的相關(guān)性定位的map吩屹。我應(yīng)用SAFE來(lái)注釋啤酒酵母基因相互作用相似性網(wǎng)絡(luò)和PPI網(wǎng)絡(luò)跪另,用GO terms。SAFE注釋的基因網(wǎng)絡(luò)匹配手工來(lái)源的注釋煤搜,花的時(shí)間少免绿,網(wǎng)絡(luò)對(duì)噪音文件和生物信號(hào)敏感。使用SAFE對(duì)基因相互作用和化學(xué)基因組數(shù)據(jù)的整合揭示了囊泡介導(dǎo)的轉(zhuǎn)運(yùn)和對(duì)抗癌藥物的抵抗之間的聯(lián)系擦盾。這些結(jié)果顯示SAFE在檢查生物網(wǎng)絡(luò)和理解他們的功能組織上的重要性嘲驾。
--
INTRODUCTION
了解活細(xì)胞的功能組織對(duì)預(yù)測(cè)細(xì)胞在正常和疾病狀態(tài)下的行為非常重要,這可以來(lái)設(shè)計(jì)有效的治療策略來(lái)控制它們厌衙。出芽啤酒酵母對(duì)闡明細(xì)胞細(xì)胞的組織尤其有用距淫,歸因于擴(kuò)展的分子相互作用網(wǎng)絡(luò)的可獲得性,可以匹配到物理婶希,生物化學(xué)和表型間聯(lián)系在幾乎genome中的所有基因。然而蓬衡,這些網(wǎng)絡(luò)的功能注釋喻杈,也就是說(shuō),決定那個(gè)生物功能可以代表每個(gè)網(wǎng)絡(luò)狰晚,網(wǎng)絡(luò)中的部分和哪些功能聯(lián)系筒饰,他們?nèi)绾魏土硗庖粋€(gè)聯(lián)系,是一個(gè)挑戰(zhàn)壁晒,尤其是因?yàn)閲?yán)格的統(tǒng)計(jì)學(xué)方法和可重復(fù)的工作流程的稀少瓷们。
生物網(wǎng)絡(luò)的系統(tǒng)注釋可以用三步闡明
首先,獲得網(wǎng)絡(luò)的綜合map秒咐,來(lái)顯示所有的nodes和他們之間的彼此聯(lián)系谬晕,這個(gè)map可以由嵌于網(wǎng)絡(luò)中的網(wǎng)絡(luò)顯示算法生成(2Dor3D),所有nodes的位置基于他們的連接性定位。
第二携取,收集可以用來(lái)定位所有nodes之間特征的獨(dú)立的數(shù)據(jù)集攒钳,這種關(guān)系基于多樣化參數(shù)(比如,細(xì)胞定位雷滋,對(duì)擾亂刺激的轉(zhuǎn)錄反應(yīng)不撑,突變表型等)。這種功能資源對(duì)酵母來(lái)說(shuō)很容易獲得晤斩,因?yàn)榧夹g(shù)進(jìn)步和很多人的貢獻(xiàn)焕檬。
最后,應(yīng)用自動(dòng)的統(tǒng)計(jì)學(xué)程序疊加共功能數(shù)據(jù)到網(wǎng)絡(luò)中并且鑒定功能一致的區(qū)域澳泵。已經(jīng)有功能區(qū)域被發(fā)現(xiàn)实愚,但是到現(xiàn)在為止,沒(méi)有已有的方法來(lái)鑒定他們,相對(duì)于彼此定位并產(chǎn)生網(wǎng)絡(luò)的功能地圖爆侣,可以被生物學(xué)界理解萍程,定量并且直觀。
這些算法的主要作用是評(píng)估實(shí)驗(yàn)數(shù)據(jù)集兔仰,并確定網(wǎng)絡(luò)連接支持的最有希望的候選基因茫负。由于網(wǎng)絡(luò)本身不是分析的重點(diǎn),而只是獨(dú)立的支持性證據(jù)乎赴,這些方法不能直接應(yīng)用于綜合性的注釋任務(wù)忍法。類似地,網(wǎng)絡(luò)聚類算法可能被用來(lái)識(shí)別與已知的以及新穎的功能模塊相對(duì)應(yīng)的密集連接的節(jié)點(diǎn)組(Newman榕吼,2006)饿序。然而,聚類忽視松散連接的節(jié)點(diǎn)羹蚣,導(dǎo)致許多稀疏但功能一致的網(wǎng)絡(luò)區(qū)域不被注意原探。另外,聚類將網(wǎng)絡(luò)劃分為離散的顽素,并且在一些情況下是重疊的子網(wǎng)絡(luò)咽弦,這些子網(wǎng)絡(luò)必須被分別注釋和整合,重新融合在一起胁出,以提供網(wǎng)絡(luò)的全局功能視圖型型。由于功能注釋的快速且可重現(xiàn)的整合尚未系統(tǒng)地實(shí)現(xiàn),因此使用用于注釋生物網(wǎng)絡(luò)的聚類算法是不切實(shí)際的全蝶。
SAFE總概
SAFE通過(guò)計(jì)算和展示一系列功能屬性來(lái)注釋生物網(wǎng)絡(luò)闹蒜。SAFE首先產(chǎn)生網(wǎng)絡(luò)2Dmap,用的是force-directed network layout算法或者從第三方軟件輸入比如cytoscape抑淫。在網(wǎng)絡(luò)map中绷落,nodes的定位基于反應(yīng)網(wǎng)絡(luò)拓?fù)洚悩?gòu)性的forces 的平衡性進(jìn)行定位,比如鏈接的nodes吸引彼此丈冬,而沒(méi)鏈接的nodes排斥嘱函。
對(duì)于網(wǎng)絡(luò)map中的每一個(gè)node來(lái)說(shuō),SAFE定義一個(gè)本地鄰居埂蕊,比如一系列nodes定位在一個(gè)特定的范圍之內(nèi)往弓,但是不必直接鏈接。下圖B蓄氧。對(duì)于每一個(gè)鄰居函似,SAFE計(jì)算一系列定量得分,每一個(gè)都相應(yīng)于鄰居的數(shù)值綜合喉童。
Benchmarking SAFE on the 酵母遺傳相互作用相似性網(wǎng)絡(luò)
為了檢驗(yàn)SAFE方法撇寞,我應(yīng)用它來(lái)注釋酵母遺傳相互作用相似性網(wǎng)絡(luò)(GIS,genetic interaction similarity),使用的GO生物過(guò)程terms作為屬性蔑担,并把這個(gè)結(jié)果與之前手工注釋的進(jìn)行比較牌废。一個(gè)遺傳相互作用是兩個(gè)基因之間的表型聯(lián)系鸟缕,遺傳相互作用是當(dāng)雙突變體的表型偏離兩個(gè)單突變體的表型的預(yù)期組合時(shí)表型關(guān)系的兩個(gè)基因。享有相似的基因相互作用的genes通常享有以共同的生物學(xué)功能并形成一個(gè)功能網(wǎng)絡(luò)排抬,并在在酵母基因組中更能有可能鏈接大多數(shù)的genes懂从。一個(gè)高度保守的網(wǎng)絡(luò)版本,包含2838個(gè)nodes蹲蒲,10016條邊番甩,通過(guò)一個(gè)徹底的,手工的程序基于原始研究進(jìn)行注釋届搁,因此它對(duì)SAFE提供了一個(gè)很好的test缘薛。(這就是benchmarking)
在cytoscape中,使用spring-embedded network layout 生成GIS(genetic interaction similarit)map卡睦。SAFE度量4373個(gè)GO生物過(guò)程條目的本地富集掩宜,每一個(gè)都至少和一個(gè)酵母gene相關(guān),揭示在size么翰,shape和GO term富集landscape的變化,fig2B,C,D辽旋。GO term的大多數(shù)84%只在是個(gè)或更少個(gè)genes鄰居內(nèi)富集浩嫌,顯示了這些term在網(wǎng)絡(luò)中太小或太稀疏分布以至于沒(méi)有功能組織的信息。Fig2b补胚。保留的GO TERMS富集在多于十個(gè)的鄰居码耐,但是在他們的富集中變化有空間分布變化:12%的GO terms(506 of 4373),有區(qū)域特異性就像它們?cè)诰W(wǎng)絡(luò)的單個(gè)區(qū)域有富集單個(gè)peak溶其。Fig2c骚腥。,4%的GO terms在不同的網(wǎng)絡(luò)區(qū)域有兩個(gè)或多個(gè)peaks多區(qū)域分布瓶逃。多個(gè)peack的出現(xiàn)顯示了每一個(gè)多區(qū)域條目包含了幾個(gè)genes的亞類束铭,分別定位在網(wǎng)絡(luò)中,這樣可以功能區(qū)分厢绝。值得注意的是契沫,每個(gè)亞類顯示被至少一個(gè)區(qū)域特異地圖覆蓋,這顯示了區(qū)域特異GO terms足夠注釋整個(gè)網(wǎng)絡(luò)昔汉,作為結(jié)果懈万,稀少的和多區(qū)域的條目不會(huì)在下一步進(jìn)行分析。
因?yàn)?06個(gè)區(qū)域特異性GO條目中的很多都匹配到同樣的網(wǎng)絡(luò)區(qū)域,他們對(duì)于網(wǎng)絡(luò)注釋的貢獻(xiàn)会通,會(huì)部分冗余口予。為了把這種冗余最小化并簡(jiǎn)化注釋過(guò)程,基于他們?cè)诟患貓D中的相似性涕侈,SAFE把這些terms歸到一個(gè)組沪停。產(chǎn)生的19個(gè)區(qū)域,用不同的顏色來(lái)代表驾凶,并且用tag lists來(lái)標(biāo)注牙甫,形成一個(gè)綜合性的,系統(tǒng)的和定量的基于GO的功能富集地圖调违,也就是GIS網(wǎng)絡(luò)窟哺。
由SAFE產(chǎn)生的功能地圖,和手工注釋的網(wǎng)絡(luò)高度一致技肩。尤其且轨,SAFE鑒定了所有的手工注釋的區(qū)域,并且和GO條目聯(lián)系在一起虚婿,匹配手工指定的標(biāo)簽旋奢。值得注意的是,SAFE也識(shí)別了三個(gè)之前沒(méi)有注釋的網(wǎng)絡(luò)區(qū)域然痊,這種丟失或許因?yàn)樗麄兊膕ize小和特異性定位至朗。
Analysis of Robustness
為了證實(shí)第一個(gè)假設(shè),我驗(yàn)證了假如node距離被定義為map-independent 度量剧浸,比如锹引,相關(guān)系數(shù)權(quán)重的最短路徑長(zhǎng)度correlation-weighted shortest path length(CSPL).在CSPL中,每一個(gè)邊的權(quán)重是1-R唆香, R是兩個(gè)鏈接的genes的遺傳相互作用profiles嫌变,并且這個(gè)value沒(méi)有參與網(wǎng)絡(luò)的構(gòu)建。由MSPL和CSPL生成的富集全景圖之間的median相似性為密度=0.7(斯皮爾曼rank相關(guān)系數(shù))2f躬它。這顯示腾啥,無(wú)論這個(gè)距離度量是什么,大多數(shù)的鄰居保持富集于同一個(gè)GOterms到一個(gè)相似的degree冯吓,并且MSPL依賴于估算node距離倘待。
默認(rèn)情況下,所有網(wǎng)絡(luò)距離中在最低的5%的在彼此的鄰居里桑谍。我驗(yàn)證了這個(gè)假設(shè)影響鄰居富集的程度延柠,通過(guò)測(cè)驗(yàn)設(shè)定一個(gè)更大的距離閾值。我發(fā)現(xiàn)锣披,增加的或減少的默認(rèn)閾值贞间,多到2倍的產(chǎn)生高度相似的富集landscapes(median 密度=0.78和0.81贿条,相應(yīng)的fig2g),這對(duì)富集的GOterms有以一個(gè)有限的影響增热。這顯示了整以,鄰居富集對(duì)鄰居的size不敏感,并且距離閾值的選擇在2倍范圍內(nèi)變化不重要峻仇。
最后我評(píng)估了網(wǎng)絡(luò)富集對(duì)spring-embedded layout algorithm的非決定性本質(zhì)的穩(wěn)健性公黑,這種算法移除了所有的nodes(這些nodes在每一次run中都有一個(gè)平衡的位置)。通過(guò)重復(fù)的應(yīng)用這個(gè)layout并比較產(chǎn)生的網(wǎng)絡(luò)地圖的富集全景摄咆,我發(fā)現(xiàn)凡蚜,平均而言,任何兩個(gè)獨(dú)立的maps的富集全景都高度相似(median across all GO 條目密度=0.82吭从,)朝蜘,這顯示,不管跨越layout runs的絕對(duì)的節(jié)點(diǎn)位置的不同涩金,鄰居保持大部分不變谱醇。為了消除殘余的可變性,以確保完整的可重復(fù)性步做,SAFE可以被設(shè)置來(lái)控制layout算法的隨機(jī)step副渴,并且在每次run中產(chǎn)生同樣的node位置。
網(wǎng)絡(luò)注釋的精確性或許也依賴于功能注釋標(biāo)準(zhǔn)的質(zhì)量全度。為了驗(yàn)證SAFE對(duì)注釋噪音的穩(wěn)健性煮剧,我系統(tǒng)的通過(guò)隨機(jī)引入不同數(shù)目的假陽(yáng)性或假陰性注釋來(lái)改變了所有的GO bp terms,并且比較產(chǎn)生的富集全景圖fig2I将鸵。沒(méi)啥問(wèn)題
SAFE促進(jìn)功能基因集的整合
因?yàn)樗懈患瘶?biāo)準(zhǔn)的內(nèi)在的偏見(jiàn)和局限轿秧,用單一類型的生物信息比如GO對(duì)一個(gè)網(wǎng)絡(luò)進(jìn)行注釋,不可能產(chǎn)生網(wǎng)絡(luò)功能組織的全景地圖咨堤。一個(gè)更有效的策略是使用多個(gè)功能數(shù)據(jù)的獨(dú)立資源,并且迭代的應(yīng)用他們來(lái)注釋同一個(gè)網(wǎng)絡(luò)漩符。這樣的方法不進(jìn)可以產(chǎn)生關(guān)于網(wǎng)絡(luò)的更真實(shí)的描述也可以揭示data 類型之間的始料未及的聯(lián)系一喘。
在酵母中,化學(xué)基因組學(xué)產(chǎn)生了功能信息的豐富的資源嗜暴。在一個(gè)化學(xué)基因組screen中凸克,基因組范圍的酵母突變體的數(shù)據(jù)在增長(zhǎng),(在多種化學(xué)復(fù)合物)闷沥,并且萎战,每一種突變都有未處理的哦。鑒定對(duì)給定的化學(xué)物敏感或不敏感的突變體對(duì)mapping 通路非常重要舆逃,而這個(gè)通路介導(dǎo)這個(gè)復(fù)合物的毒性或?qū)ΡWo(hù)細(xì)胞免于致死效應(yīng)是必須的蚂维。我假說(shuō)推斷SAFE通過(guò)用化學(xué)基因組data注釋GIS網(wǎng)絡(luò)可以協(xié)助鑒定這些通路戳粒,并且可以鑒定對(duì)化學(xué)物敏感或不敏感的功能網(wǎng)絡(luò)區(qū)域。
為了驗(yàn)證這個(gè)假設(shè)虫啥,我使用最近的一個(gè)化學(xué)基因組數(shù)據(jù)蔚约,它測(cè)量了大量的fittness分?jǐn)?shù)涂籽,對(duì)大概5000個(gè)酵母同源刪除突變體,暴露于132個(gè)化學(xué)復(fù)合物,這些化合物有已知的作用模式砂轻。使用這些數(shù)據(jù)舔清,SAFE產(chǎn)生了132個(gè)復(fù)合物特異的fitness富集全景圖体谒,并且mapped相應(yīng)的敏感和抵抗的突變體抒痒,通過(guò)GIS網(wǎng)絡(luò)故响,fig3ABC.
通過(guò)對(duì)fitness富集全景圖的分析(GO biological process)彩届,顯示樟蠕,全景圖與我們當(dāng)前的知識(shí)高度一致寨辩。例如靡狞,對(duì)doxorubicin這個(gè)DNA嵌入劑敏感的突變體甘穿,通過(guò)阻斷拓?fù)洚悩?gòu)酶II來(lái)阻斷DNA復(fù)制扒磁,這種突變體主要在以下生理活動(dòng)相關(guān)的網(wǎng)絡(luò)region中富集妨托,DNA復(fù)制和修復(fù),相似的敦腔,一個(gè)靶向線粒體的蛋白質(zhì)合成抑制劑在核糖體和線粒體相關(guān)的GO條目也富集重疊符衔。
Case study:SAFE揭示抗Bortezomib(蛋白酶體抑制劑硼替佐米)的機(jī)制
除了已知的復(fù)合物作用模式判族,SAFE也可以揭示新的反應(yīng)模式。
一個(gè)例子是關(guān)于bortezomib的fitness富集全景圖辩撑,這是一種蛋白酶體抑制劑合冀,已經(jīng)證實(shí)可以用了治療多發(fā)性骨髓病,多發(fā)性淋巴瘤和其它幾種正在接收臨床實(shí)驗(yàn)的類型的癌癥。SAFE分析顯示啥箭,在酵母中急侥,對(duì)bortezomib敏感的突變體主要在和蛋白酶體介導(dǎo)的蛋白降解坏怪,細(xì)胞周期控制和轉(zhuǎn)錄調(diào)控相關(guān)網(wǎng)絡(luò)區(qū)域富集fig3c打掘。這些結(jié)果與人類細(xì)胞中的發(fā)現(xiàn)一致尊蚁,bortezomib不直接通過(guò)保護(hù)促死亡因子來(lái)促進(jìn)程序化細(xì)胞死亡,是協(xié)同的組蛋白去甲基化抑制劑琴锭,來(lái)調(diào)控轉(zhuǎn)錄决帖。
值得注意的是,SAFE也顯示落君,抗bortezomib和網(wǎng)絡(luò)中的分泌和囊泡介導(dǎo)的轉(zhuǎn)運(yùn)go term強(qiáng)烈相關(guān)fig3c。雖然幾個(gè)報(bào)道已經(jīng)顯示纹冤,蛋白酶體的失活可以通過(guò)內(nèi)質(zhì)網(wǎng)中的錯(cuò)誤折疊蛋白的聚集引起內(nèi)質(zhì)網(wǎng)stress,但是沒(méi)有預(yù)料失去功能的突變體在ER或其他囊泡相關(guān)的功能可以減弱這個(gè)或其他蛋白媒體相關(guān)的壓力知残。有一個(gè)直接的關(guān)于bortezomib的實(shí)驗(yàn)可以證實(shí)SAFE的富集分析:對(duì)藥物最強(qiáng)抵抗的四個(gè)突變株乏盐,執(zhí)行了完全或部分的敲除在YTP6,RIC1,RGP1基因,調(diào)控形成何吝,移動(dòng)或囊泡融合,從高爾基體區(qū)域呆细。另外,幾個(gè)卷入高爾基相關(guān)的其他價(jià)格i額蛋白也在抗突變的前15之內(nèi)坑夯。
這個(gè)發(fā)現(xiàn)的統(tǒng)計(jì)學(xué)重要性也被網(wǎng)絡(luò)獨(dú)立基因集GSEA支持。GSEA決定功能組的成員是否傾向于在ranked基因列表的top或底部出現(xiàn),然后來(lái)檢測(cè)這種分布的可能性秘噪。通過(guò)對(duì)ranked list of bortezomib fitness得分應(yīng)用GSEA,所有4373個(gè)GO BP,我確認(rèn)了想高爾基體內(nèi)囊泡介導(dǎo)的轉(zhuǎn)運(yùn)和細(xì)胞質(zhì)到囊泡靶向途徑顯著富集像街。和SAFE的結(jié)果相比,然而跟狱,這些pathways的首要的在GSEA中卻更少的出現(xiàn):
GSEA檢測(cè)到的48個(gè)顯著的GO條目的大多數(shù)(58%)涉及離子穩(wěn)態(tài),細(xì)胞內(nèi)pH調(diào)節(jié),還有其他距離相關(guān)的功能相關(guān)的。這種不一致顯示了爽茴,通過(guò)影響網(wǎng)絡(luò)拓?fù)湫裕琒AFE可以檢測(cè)功能信號(hào)胧沫,這些信號(hào)在網(wǎng)絡(luò)非依賴型分析中不容易出現(xiàn)纺酸。
更復(fù)雜網(wǎng)絡(luò)的注釋:包括蛋白蛋白相互作用網(wǎng)絡(luò)
和其他生物網(wǎng)絡(luò)相比碎紊,GIS網(wǎng)絡(luò)相對(duì)稀少和模塊化fig2a词爬,并且也可能順從于注釋锅锨。為了評(píng)估是否SAFE也可以用來(lái)注釋更復(fù)雜的網(wǎng)絡(luò),我首先驗(yàn)證了它是否可以在一個(gè)GIS網(wǎng)絡(luò)更稠密的版本中檢測(cè)到功能富集信息,這個(gè)版本通過(guò)降低GIS閾值的最小值來(lái)獲取,這個(gè)最小值是連接性所需要的。對(duì)GIS網(wǎng)絡(luò)的注釋with40%-240%更多的邊比原始產(chǎn)生的相似性GO條目富集全景圖(median 密度=0.61-0.75),顯示不管網(wǎng)絡(luò)的密度,SAFE對(duì)內(nèi)在的功能結(jié)構(gòu)比較敏感。
也可能,更復(fù)雜的生物網(wǎng)絡(luò)沒(méi)有一個(gè)像GIS一樣重要的結(jié)構(gòu),這樣注釋更加困難。因此,我廣泛的PPI 網(wǎng)絡(luò)蛮拔,在5699個(gè)酵母蛋白質(zhì)中產(chǎn)生了多至78406個(gè)物理綁定踱卵。PPI優(yōu)先鏈接相同的蛋白復(fù)合體成員和其他功能相關(guān)的蛋白绳锅,這個(gè)網(wǎng)絡(luò)地圖原朝,在全局范圍內(nèi)沒(méi)有顯示出可見(jiàn)的拓?fù)浣Y(jié)構(gòu)fig4a茂蚓。然而壕鹉,SAFE揭示了網(wǎng)絡(luò)中的21個(gè)大的功能域,每個(gè)domain和一個(gè)明確的GO term富集聋涨,還有一個(gè)唯一的富集的go terms列表fie4B晾浴。這個(gè)富集地圖結(jié)果強(qiáng)烈顯示了物理結(jié)合,就像GIS牍白,可以把蛋白質(zhì)聚成一個(gè)大的功能單位脊凰,這個(gè)大的功能單位超越了蛋白復(fù)合體和分子通路。這些復(fù)合體的相對(duì)網(wǎng)絡(luò)定位茂腥,連同他們的GIS部分狸涌,對(duì)酵母細(xì)胞的功能組織或許可以提供一個(gè)新的視野。
DISCUSSION
這里础芍,我描述了SAFE的發(fā)展杈抢,驗(yàn)證和應(yīng)用,這是一種注釋生物網(wǎng)絡(luò)仑性,檢測(cè)其功能組織的自動(dòng)化方法惶楼。考慮到網(wǎng)絡(luò)和可視化map的連接性,SAFE定位所有的網(wǎng)絡(luò)區(qū)域歼捐,在一個(gè)或更多功能屬性富集的何陆,比如GOterm,或定量表型豹储。這個(gè)過(guò)程中贷盲,SAFE回答三個(gè)基本的問(wèn)題,
第一剥扣,網(wǎng)絡(luò)中的任何區(qū)域是不是特異性的和一個(gè)給定的功能或表型相關(guān)巩剖?
第二,這些區(qū)域定位在網(wǎng)絡(luò)的什么位置
第三钠怯,他們的定位如何與其他功能或表型進(jìn)行比較
通過(guò)回答這些問(wèn)題佳魔,SAFE建立了一個(gè)網(wǎng)絡(luò)功能地圖,并探索細(xì)胞內(nèi)的過(guò)程關(guān)系晦炊。
通過(guò)可視化的力量鞠鲜,SAFE也可以用來(lái)提高我們對(duì)功能標(biāo)準(zhǔn)的理解。例如断国,SAFE 用GO生物過(guò)程進(jìn)行的GIS網(wǎng)絡(luò)的注釋顯示贤姆,一些GO term富集在單一的網(wǎng)絡(luò)區(qū)域,而其他的是多區(qū)域稳衬。雖然多區(qū)域GO terms比特定區(qū)域的數(shù)目要大霞捡,但是他們的size分布會(huì)產(chǎn)生更多的重疊。這顯示了term size不僅僅貢獻(xiàn)于全景差異薄疚。一個(gè)有趣的可能是弄砍,區(qū)域特異的GO term共享一個(gè)功能特異的相似性水平,這是有GIS網(wǎng)絡(luò)的拓?fù)湫投x的输涕。如果事實(shí)如此音婶,這些terms可以用來(lái)delineate描繪一個(gè)GO等級(jí)聚類的剖面(cross-section)并且產(chǎn)生GO 注釋的扁平subset,和GO slim相似莱坎。在基因組中扁平化注釋很重要衣式,這歸于它們的小size和低的冗余。SAFE或許可以提供產(chǎn)生數(shù)據(jù)驅(qū)動(dòng)的網(wǎng)絡(luò)特異性注釋標(biāo)準(zhǔn)的生成檐什,這可以使得更多的靶向的功能分析成為可能并簡(jiǎn)化他們的解釋碴卧。
SAFE功能maps的解釋會(huì)從一個(gè)更好的網(wǎng)絡(luò)layout算法中受益。數(shù)據(jù)驅(qū)動(dòng)的網(wǎng)絡(luò)輸出乃正,比如spring embedded住册, 是一種非監(jiān)督方法可以基于nodes的連接度來(lái)組織nodes坦弟,并且事實(shí)上是多維度還原程序慷暂。在這個(gè)默認(rèn)setup中给僵,SAFE依賴layouts鑒定本地鄰居并且匹配他們的功能富集滓玖。然而,一個(gè)特別的layout如何被選擇叹阔,我們?nèi)匀恢赖奶倌又帷2还芩麄冊(cè)诮沂緮?shù)據(jù)內(nèi)部的隱含模式的巨大潛能,layouts可以典型用來(lái)產(chǎn)生esthetically pleasing(賞心悅目的) network visualizations(賞心悅目的網(wǎng)絡(luò)可視化)全景圖并且很少是任何系統(tǒng)網(wǎng)絡(luò)分析的基礎(chǔ)耳幢。結(jié)果而言岸晦,我們?cè)谠u(píng)估網(wǎng)絡(luò)輸出方面有有限的經(jīng)驗(yàn),并且在不同的網(wǎng)絡(luò)中相對(duì)的表現(xiàn)有很少的理解睛藻。SAFE或許對(duì)同一個(gè)網(wǎng)絡(luò)使用普通的功能屬性進(jìn)行可變的layouts有一些評(píng)估作用启上。理想狀態(tài)是,這樣的分析能夠?yàn)槊恳粋€(gè)網(wǎng)絡(luò)類型鑒定最佳的layouts并且為比較網(wǎng)絡(luò)建立共同的ground店印。
生物網(wǎng)絡(luò)的定量比較是系統(tǒng)生物學(xué)的大目標(biāo)碧绞。對(duì)不同網(wǎng)絡(luò)類型中的genes,通路和過(guò)程是如何連接的深入理解有助于對(duì)開(kāi)發(fā)成功的策略(對(duì)一個(gè)細(xì)胞中吱窝,整合多個(gè)網(wǎng)絡(luò)成一個(gè)single綜合的模型)。通過(guò)把相同的功能屬性map到不同的網(wǎng)絡(luò)富集中迫靖,SAFE可以對(duì)這個(gè)目標(biāo)有重要的貢獻(xiàn)院峡。然而,謹(jǐn)慎的統(tǒng)計(jì)學(xué)方法一定被內(nèi)置來(lái)比較SAFE的跨網(wǎng)絡(luò)maps并且得出有意義的結(jié)論系宜,關(guān)于他們的不同和相似照激。
總之,SAFE對(duì)網(wǎng)絡(luò)中的功能組織提供了一個(gè)總體的視角盹牧,通過(guò)在功能groups和網(wǎng)絡(luò)區(qū)域之間map統(tǒng)計(jì)學(xué)聯(lián)系俩垃。和其他網(wǎng)絡(luò)分析的方法相比(其他方法抽取網(wǎng)絡(luò)區(qū)域并獨(dú)立比較他們)。SAFE顯示汰寓,網(wǎng)絡(luò)輸出合并它們的穩(wěn)健富集分析口柳,是一個(gè)有效的分析完整分子網(wǎng)絡(luò)的策略,可以對(duì)他們代表的生物系統(tǒng)獲得視角有滑。
Natrue biotechnology文章
Dosage suppression genetic interaction networks enhance functional wiring diagrams of the cell
DOI: 10.1038/nbt.1855 · Source: PubMed
Results
A global dosage suppression genetic interaction network
我們收集了424個(gè)必須基因的一系列dosage suppression genetic interactions 跃闹,我們稱之為query基因,他們?cè)赟GD中被注釋毛好。這些相互作用形成一個(gè)網(wǎng)絡(luò)包含768個(gè)genes和1293條邊望艺。大部分query genes只有少數(shù)dosage suppressors,雖然少數(shù)基因有大的interactions肌访。我們?cè)赾ytoscape中使用force-directed layout展示找默,這樣的,擁有共同的dosage suppression 相互作用的genes會(huì)形成清晰的明顯的clusters吼驶。Markov聚類分析鑒定出9個(gè)clusters惩激,每個(gè)包含大于等于30個(gè)genens店煞,都對(duì)應(yīng)特定的生物學(xué)過(guò)程。和綜合的基因網(wǎng)絡(luò)相似咧欣,這些clusters之間的相對(duì)距離看起來(lái)反應(yīng)了共享的或共有的功能浅缸。(大概意思是說(shuō),網(wǎng)絡(luò)中離的近魄咕,說(shuō)明功能有相似性衩椒,基因有重疊)例如,下圖中vesicle-mediated transport哮兰,exocytosis和細(xì)胞生長(zhǎng)和形態(tài)生成三個(gè)cluster的genes在網(wǎng)絡(luò)的相對(duì)接近揭示了他們之間的功能聯(lián)系毛萌,這揭示了,這種相互作用可以獨(dú)立的用來(lái)cluster基因喝滞,基于功能相互關(guān)系阁将。