CancerGeneNet:將驅(qū)動(dòng)基因與癌癥標(biāo)志聯(lián)系起來(lái)

Iannuccelli M, Micarelli E, Surdo PL, et al. CancerGeneNet: linking driver genes to cancer hallmarks. Nucleic Acids Res. 2020;48(D1):D416-D421. doi:10.1093/nar/gkz871


摘要

CancerGeneNet (https://signor.uniroma2.it/CancerGeneNet/) 是將癌癥中經(jīng)常發(fā)生突變的基因與癌癥表型聯(lián)系起來(lái)的資源冲呢。資源利用了管理工作的優(yōu)勢(shì),旨在將在癌細(xì)胞中發(fā)現(xiàn)的大部分基因產(chǎn)物嵌入到因果蛋白質(zhì)關(guān)系網(wǎng)絡(luò)中玻佩。反過(guò)來(lái)尚猿,圖算法允許推斷將癌癥相關(guān)基因與癌癥表型聯(lián)系起來(lái)的因果相互作用的可能路徑葫笼,從而為設(shè)計(jì)恢復(fù)疾病表型的策略提供了一個(gè)合理的框架沟沙。 CancerGeneNet 通過(guò)將活動(dòng)受癌癥驅(qū)動(dòng)因素影響的蛋白質(zhì)與影響“癌癥標(biāo)志”的蛋白質(zhì)連接起來(lái),連接了兩個(gè)相互作用層敷待。此外场仲,CancerGeneNet 注釋了與合理化選定常見(jiàn)癌癥中癌癥驅(qū)動(dòng)突變的病理后果相關(guān)的策劃途徑和悦,以及說(shuō)明在不同癌癥中經(jīng)常改變的調(diào)節(jié)回路的“MiniPathways”。


介紹

能夠在一天內(nèi)以與傳統(tǒng)診斷方法相媲美的成本對(duì)整個(gè)基因組進(jìn)行測(cè)序渠缕,這有助于組裝大量癌癥基因組鸽素,這些基因組可在公共存儲(chǔ)庫(kù)中免費(fèi)訪問(wèn) ( 1 )。反過(guò)來(lái)亦鳞,與患者非轉(zhuǎn)化組織的基因組序列進(jìn)行比較馍忽,可以通過(guò)識(shí)別在特定腫瘤類(lèi)型中經(jīng)常發(fā)生突變的基因來(lái)定義癌癥基因組圖譜 ( 2 )。利用這些信息燕差,COSMIC 癌癥基因普查 (CGC) ( 3 ) 列出了與不同癌癥的發(fā)病和進(jìn)展有因果關(guān)系的基因列表遭笋。額外的獨(dú)立策劃工作,例如比較毒物基因組學(xué)數(shù)據(jù)庫(kù)(4)徒探、IntOGen ( 5 )瓦呼、DriverDBv2 ( 6 ) 或 UniProtKB 聯(lián)盟 ( 7 ) 和其他人都瞄準(zhǔn)了類(lèi)似的目標(biāo),盡管采用不同的策略并使用不同的標(biāo)準(zhǔn)來(lái)過(guò)濾基因-癌癥關(guān)聯(lián)的實(shí)驗(yàn)支持测暗。DisGeNET 項(xiàng)目(8) 列出了與 738 種腫瘤疾病相關(guān)的 4145 個(gè)基因央串。然而磨澡,盡管這些研究在某些情況下導(dǎo)致了對(duì)潛在因果變異的精細(xì)映射并產(chǎn)生了一些機(jī)制見(jiàn)解,但我們對(duì)遺傳變異與癌癥發(fā)病和進(jìn)展之間聯(lián)系的理解仍然有限质和。Hanahan 和 Weinberg 的一篇開(kāi)創(chuàng)性論文提供了一個(gè)廣泛使用的概念框架(癌癥的標(biāo)志)稳摄,以合理化腫瘤疾病的復(fù)雜性 ( 9 )。現(xiàn)在的挑戰(zhàn)是在癌癥中經(jīng)常突變的基因和“標(biāo)志性表型”之間建立功能路徑侦另。這些信息可能有助于設(shè)計(jì)恢復(fù)癌癥表型的治療策略秩命。

CGC 小組已經(jīng)開(kāi)始了一項(xiàng)策展工作并篩選了文獻(xiàn)以恢復(fù)將癌癥基因與癌癥表型相關(guān)的實(shí)驗(yàn)信息 ( 3 )。

數(shù)據(jù)庫(kù) CancerGeneNet ( https://signor.uniroma2.it/CancerGeneNet/ ) 旨在通過(guò)使用不同的無(wú)偏見(jiàn)方法來(lái)解決類(lèi)似的挑戰(zhàn)褒傅,該方法旨在精確識(shí)別解釋癌癥基因突變對(duì)癌癥表型影響的因果關(guān)系鏈。該資源基于實(shí)驗(yàn)信息的注釋?zhuān)试S將癌癥基因嵌入因果蛋白質(zhì)關(guān)系的細(xì)胞網(wǎng)絡(luò)中袄友。它基于三個(gè)管理工作和一組圖形算法來(lái)連接基因列表并找到網(wǎng)絡(luò)上任意兩個(gè)節(jié)點(diǎn)之間的最短路徑殿托。

CancerGeneNet 利用 SIGNOR ( 10 ) 中策劃的global因果網(wǎng)絡(luò),這是一個(gè)策劃邏輯關(guān)系的數(shù)據(jù)庫(kù)剧蚣,它為研究不同信號(hào)蛋白之間的信息流提供了一個(gè)框架支竹,從而將基因與表型聯(lián)系起來(lái)。


詳細(xì)結(jié)果請(qǐng)看原文
https://academic.oup.com/nar/article/48/D1/D416/5584570?login=false


材料和方法

癌癥基因列表

我們利用了兩個(gè)癌癥相關(guān)基因列表(補(bǔ)充表 S2)鸠按。第一個(gè)列表是專(zhuān)家策劃的列表礼搁,從 CGC 網(wǎng)站 (v89) ( 3 ) 下載。普查將 710 個(gè)基因與 354 種腫瘤類(lèi)型相關(guān)聯(lián)目尖。第二個(gè)列表是從文件“Curated gene-disease associations”(DisGeNET v 6.0)( 8)馒吴。我們選擇了疾病類(lèi)型“疾病”和疾病語(yǔ)義類(lèi)型“腫瘤過(guò)程”的記錄,得到了與 710 種腫瘤類(lèi)型相關(guān)的 4145 個(gè)癌癥基因的列表瑟曲。雖然 CGC 是一個(gè)精選列表饮戳,但 DisGeNET 資源整合了來(lái)自不同資源的數(shù)據(jù),并且在納入標(biāo)準(zhǔn)方面的選擇性要低得多洞拨。結(jié)果扯罐,一些腫瘤與大量基因相關(guān),多達(dá)~1000個(gè)烦衣。然而歹河,DisGeNET 列表可以根據(jù)取決于支持證據(jù)的分?jǐn)?shù)進(jìn)行排名。在 CancerGeneNet 中花吟,DisGeNET 癌癥基因列表被截?cái)酁榈梅肿罡叩?50 個(gè)基因秸歧。

策展規(guī)則和策略

通過(guò)標(biāo)準(zhǔn)方法(PubMed 和 Google 搜索)在科學(xué)文獻(xiàn)中搜索了有關(guān)連接癌癥基因、癌癥表型和癌癥藥物的邏輯關(guān)系的信息示辈。檢索到的文章由專(zhuān)家策展人過(guò)濾寥茫,并根據(jù) SIGNOR 策展模型在數(shù)據(jù)庫(kù)中注釋相關(guān)信息。

癌癥表型矾麻,形成 CancerGeneNet 圖的終點(diǎn)纱耻,是“癌癥標(biāo)志”的縮短版本 ( 9 )芭梯。CancerGeneNet 中的癌癥標(biāo)志和癌癥表型之間的映射報(bào)告于補(bǔ)充表 S1。我們沒(méi)有考慮“避免免疫破壞”弄喘,因?yàn)檫@個(gè)標(biāo)志涉及不同細(xì)胞類(lèi)型之間的相互作用玖喘,我們添加了表型“分化”。標(biāo)志性的“失調(diào)的細(xì)胞能量學(xué)”包含大量非常不同的“代謝表型”蘑志。在我們的分析中包含所有這些表型會(huì)使管理工作復(fù)雜化累奈,增加搜索算法的負(fù)擔(dān)并混淆結(jié)果頁(yè)面。我們將努力限制在“糖酵解”表型上急但,因?yàn)檫@種代謝途徑的調(diào)節(jié)可能是研究得最好的澎媒,而有氧糖酵解是 Warburg 效應(yīng)最清晰的讀數(shù)。

最后波桩,我們利用最近的一篇論文 ( 11 )戒努,該論文提供了 FDA 批準(zhǔn)的抗癌藥物及其靶點(diǎn)列表,手動(dòng)注釋了 91 個(gè) FDA 藥物和 105 個(gè)基因靶點(diǎn)镐躲。

數(shù)據(jù)庫(kù)結(jié)構(gòu)和門(mén)戶(hù)網(wǎng)站實(shí)現(xiàn)

數(shù)據(jù)通過(guò)基于 HTML5 的 Web 界面呈現(xiàn)給用戶(hù)储玫,并與 JavaScript 腳本集成,以提供更加動(dòng)態(tài)和響應(yīng)迅速的用戶(hù)交互萤皂。大多數(shù)數(shù)據(jù)操作和顯示都是通過(guò) PHP(7.0.33 版)處理的撒穷。R 腳本用于提取更多有意義的信息。網(wǎng)絡(luò)查看器是使用 SPV (Signaling Pathway Visualizer, v1.0) ( 12 ) 創(chuàng)建的裆熙。

圖算法

使用 R igraph ( 13 )的最短路徑功能以編程方式識(shí)別特定基因和癌癥表型之間的最短路徑端礼。此函數(shù)返回鏈接有向圖中任意兩個(gè)節(jié)點(diǎn)的所有最短路徑,例如 SIGNOR 中的那個(gè)弛车。為了讓用戶(hù)能夠探索與最短路徑不同但可能與生物學(xué)相關(guān)的路徑齐媒,我們使用了在NetworkX 模塊中實(shí)現(xiàn)的函數(shù)all_simple_paths ( 14) 的 Python 語(yǔ)言。實(shí)現(xiàn)的函數(shù)返回將查詢(xún)基因鏈接到目標(biāo)表型的所有最短路徑纷跛,并添加那些長(zhǎng)一步的路徑喻括。生成的路徑列表通過(guò)使用路徑長(zhǎng)度的度量來(lái)排名相關(guān)性,該度量考慮了形成路徑的每個(gè)邊緣的“可靠性”贫奠,如 SIGNOR 中所定義(Licata et al.正在提交給 NAR 數(shù)據(jù)庫(kù)問(wèn)題)唬血。該可靠性分?jǐn)?shù)結(jié)合了支持策劃關(guān)系的功能相關(guān)性的四個(gè)特征:(i)支持 SIGNOR 中交互的參考(PMID)的數(shù)量,(ii)包括交互的 SIGNOR 路徑的數(shù)量唤崭,(iii)數(shù)量Reactome 交互組中關(guān)系的出現(xiàn)次數(shù)和 (iv) 在 UNIPROT 源實(shí)體頁(yè)面中提及目標(biāo)實(shí)體的次數(shù)拷恨。組合的可靠性得分范圍從 0 到 1。接下來(lái)谢肾,我們通過(guò)以下簡(jiǎn)單關(guān)系d = 1 – r定義了與可靠性 ( r ) 相關(guān)聯(lián)的節(jié)點(diǎn)距離 ( d ) 腕侄。

總路徑長(zhǎng)度是路徑中所有邊的長(zhǎng)度之和。我們還評(píng)估了蛋白質(zhì)活性對(duì)表型的影響,其中包含 0 個(gè)或偶數(shù)個(gè)抑制步驟的路徑被定義為表型激活劑冕杠,否則被視為表型抑制劑微姊。

癌癥相似性網(wǎng)絡(luò)

癌癥相似性網(wǎng)絡(luò)提供了對(duì)資源中數(shù)據(jù)的替代訪問(wèn)。為了繪制網(wǎng)絡(luò)分预,我們首先通過(guò)比較任何一對(duì)癌癥之間的癌癥相關(guān)基因列表來(lái)計(jì)算 Jaccard 指數(shù)兢交。對(duì)于 DisGeNET 基因列表,我們將計(jì)算限制為 50 個(gè)具有較高腫瘤關(guān)聯(lián)評(píng)分的基因笼痹。Jaccard 指數(shù)高于任意選擇的閾值的癌癥由圖中的邊連接配喳。該網(wǎng)絡(luò)在主頁(yè)上顯示了 Cytoscape.js ( 16 ),這是一個(gè)用于圖形可視化和分析的 Javascript 庫(kù)凳干。節(jié)點(diǎn)(癌癥)大小映射到相關(guān)基因的數(shù)量晴裹。邊寬與P的-log10有關(guān)--通過(guò) Fisher 精確檢驗(yàn)計(jì)算的值。CGC 和 DisGeNET 數(shù)據(jù)集的圖形均使用歐拉布局呈現(xiàn)纺座。為避免 DisGeNET 圖過(guò)于擁擠息拜,未顯示具有三個(gè)或更少相關(guān)基因的癌癥。


結(jié)果

檢索因果交互作用的實(shí)驗(yàn)信息

CancerGeneNet 項(xiàng)目旨在通過(guò)蛋白質(zhì)之間的因果相互作用將與癌癥有關(guān)的基因與癌癥表型聯(lián)系起來(lái)(圖1A)净响。兩個(gè)癌癥相關(guān)基因列表分別來(lái)自 CGC ( 3 ) 和 DisGeNET ( 8 ) (補(bǔ)充表 S2)。這兩種資源使用不同的納入策略和嚴(yán)格標(biāo)準(zhǔn)喳瓣。因此馋贤,這兩個(gè)列表的大小不同(分別為 710 和 4145 個(gè)基因產(chǎn)物),兩個(gè)列表中只有 531 個(gè)基因是共同的(圖1B)畏陕。在這個(gè)項(xiàng)目開(kāi)始時(shí)配乓,我們監(jiān)測(cè)了在 SIGNOR 中至少有一次交互的 CGC 部分。事實(shí)證明惠毁,SIGNOR 網(wǎng)絡(luò)中沒(méi)有注釋~300 個(gè) CGC 基因(~40%)犹芹。因此,我們開(kāi)始了一項(xiàng)策劃活動(dòng)鞠绰,以尋找有關(guān)癌癥基因擾動(dòng)對(duì)細(xì)胞蛋白質(zhì)組中其他蛋白質(zhì)活性的影響的已發(fā)表信息腰埂。在這項(xiàng)工作結(jié)束時(shí),整合到因果網(wǎng)絡(luò)中的癌癥基因的百分比上升到 80%蜈膨。與 CGC 中的基因相關(guān)的關(guān)系數(shù)量從零(142 個(gè)基因)到 214(對(duì)于 AKT1)不等屿笼,如圖1 C所示。

數(shù)據(jù)庫(kù)內(nèi)容翁巍。( A ) CancerGeneNet 數(shù)據(jù)庫(kù)中分層信息的示意圖驴一。第二層代表專(zhuān)門(mén)為該項(xiàng)目策劃的癌癥基因網(wǎng)絡(luò)。頂層的黃色六邊形代表靶向敏感信號(hào)蛋白的抗癌藥物灶壶。癌癥基因影響 SIGNOR 中的因果相互作用組網(wǎng)絡(luò)(淺綠色圓圈)肝断,直接影響癌癥表型(綠色矩形)。( B ) 癌癥基因普查和 DisGeNET 中注釋的癌癥基因的維恩圖。( C ) 直方圖胸懈,表示癌癥基因普查庫(kù)中每個(gè)癌癥基因的關(guān)系數(shù)量分布担扑。( D)該圖說(shuō)明了(i)在Signor中注釋的蛋白質(zhì)集合的大小,(ii)包含在癌癥基因普查中箫荡,(iii)抗癌藥物的特定靶標(biāo)或(iv)已被注釋為表型修飾符魁亦。

可以從 CancerGeneNet 中的精選信息中提取的圖是一個(gè)三方符號(hào)的有向圖,將癌癥相關(guān)基因產(chǎn)物與癌癥表型和抗癌藥物聯(lián)系起來(lái)(圖1A)羔挡。為該項(xiàng)目注釋的交互已被選中洁奈,因?yàn)樗鼈兣c癌癥通路的調(diào)節(jié)相關(guān),并已根據(jù) SIGNOR 數(shù)據(jù)模型 ( 10 ) 和管理規(guī)則進(jìn)行管理绞灼,遵循“因果標(biāo)簽”標(biāo)準(zhǔn) ( 17 ))利术。我們首先尋找有關(guān) CGC 中列出的基因產(chǎn)物與人類(lèi)蛋白質(zhì)組中的蛋白質(zhì)之間因果關(guān)系(即蛋白質(zhì) A 激活蛋白質(zhì) B)的實(shí)驗(yàn)信息。因果關(guān)系及其符號(hào)取決于遺傳背景低矮。CancerGeneNet 中的所有注釋都指的是野生類(lèi)型的背景印叁。在推斷出突變對(duì)蛋白質(zhì)活性的影響后,需要評(píng)估每個(gè)激活/失活突變對(duì)疾病背景下信息流程的影響军掂。

通過(guò)這種方法轮蜕,我們已經(jīng)策劃了~6000個(gè)新的相互作用。然而蝗锥,142個(gè)癌癥基因(?20%)保持不協(xié)調(diào)跃洛,因此與global因果細(xì)胞互作組分開(kāi)(補(bǔ)充表 S3)。對(duì)于這些基因中的大多數(shù)终议,無(wú)法找到關(guān)于它們與癌癥促進(jìn)聯(lián)系的直接邏輯相互作用的可靠信息汇竭。

接下來(lái),我們已經(jīng)確定了在過(guò)表達(dá)或失活時(shí)(~120 種蛋白質(zhì))被證明會(huì)影響癌癥表型的蛋白質(zhì)(例如 p53 表示“細(xì)胞死亡”)穴张。這一步具有一定程度的隨意性细燎,因?yàn)樵S多基因或多或少直接與某些特征相關(guān)聯(lián)。我們選擇了八種表型皂甘,這些表型在我們的數(shù)據(jù)模型中很容易實(shí)現(xiàn)玻驻,并且可以映射到癌癥標(biāo)志(補(bǔ)充表 S1)。最后叮贩,我們將這兩個(gè)交互層嵌入到全局人類(lèi)細(xì)胞因果交互組中击狮,正如 SIGNOR 數(shù)據(jù)庫(kù)中所注釋的那樣。

在第三項(xiàng)策展工作中益老,我們注釋了用于治療的抗癌藥物與其靶向蛋白質(zhì)之間的因果相互作用(圖1D)(11)彪蓬。

此外,在不同腫瘤中經(jīng)常改變的癌癥通路和 MiniPathways 已被手動(dòng)管理捺萌,允許分析通路串?dāng)_并將推斷的癌癥網(wǎng)絡(luò)與癌癥中經(jīng)常改變的過(guò)程進(jìn)行比較档冬。我們?yōu)槊總€(gè)注釋的癌癥通路定義了一組 20-30 種蛋白質(zhì),這些蛋白質(zhì)通常在腫瘤中發(fā)生突變或表達(dá)受到干擾。癌癥通路是連接“種子”實(shí)體的關(guān)系集合酷誓。MiniPathway 是較小的網(wǎng)絡(luò)(大約 10-15 個(gè)實(shí)體)披坏,描述了在不同類(lèi)型的癌癥中經(jīng)常受到干擾的信號(hào)轉(zhuǎn)導(dǎo)模塊乾颁。

數(shù)據(jù)庫(kù)接口

開(kāi)發(fā) CancerGeneNet 資源的主要?jiǎng)訖C(jī)是提供一個(gè)因果關(guān)系數(shù)據(jù)庫(kù)和工具展东,以幫助 (i) 推斷將癌癥相關(guān)基因與癌癥相關(guān)表型聯(lián)系起來(lái)的路徑,以及 (ii) 識(shí)別發(fā)現(xiàn)突變的基因之間的功能相關(guān)性通過(guò)建立因果關(guān)系網(wǎng)絡(luò)來(lái)治療癌癥写隶。

網(wǎng)站主頁(yè)提供了四個(gè)入口點(diǎn)來(lái)搜索和查詢(xún)數(shù)據(jù)庫(kù)玫氢。

左上角的面板允許輸入任何基因(Uniprot ID 或基因名稱(chēng))或基因列表帚屉,并在數(shù)據(jù)庫(kù)中查詢(xún)連接感興趣基因和表征癌癥的八種表型的最短因果路徑⊙浚可以單獨(dú)或同時(shí)搜索連接任何基因和八個(gè)標(biāo)志的路徑攻旦。路徑搜索算法的結(jié)果顯示為顯示將查詢(xún)基因連接到表型的相互作用的圖表,以及列出所有最短路徑和長(zhǎng)一步的表的表格生逸。根據(jù)方法中描述的可靠性度量對(duì)路徑進(jìn)行排名并在表格中列出牢屋,并用綠色或紅色勾勒以分別識(shí)別激活和抑制路徑。

CancerGeneNet 還提供了第二個(gè)功能槽袄,幫助解決查找列表中的基因(例如與給定癌癥相關(guān)的基因列表)是否通過(guò)因果關(guān)系聯(lián)系起來(lái)的任務(wù)烙无。這可以通過(guò)在下拉菜單中或在代表癌癥相似性的網(wǎng)絡(luò)中搜索特定癌癥來(lái)實(shí)現(xiàn),這通過(guò)計(jì)算癌癥基因列表中每對(duì)腫瘤的 Jaccard 指數(shù)來(lái)確定遍尺。兩個(gè)入口點(diǎn)均可用于訪問(wèn) CGC 或 DisGeNET 數(shù)據(jù)集皱炉。通過(guò)在下拉菜單中選擇給定的癌癥或通過(guò)單擊相似性網(wǎng)絡(luò)中節(jié)點(diǎn)彈出窗口中的“連接驅(qū)動(dòng)基因”,用戶(hù)可以啟動(dòng)搜索以尋找癌癥相關(guān)基因之間的邏輯關(guān)系狮鸭。三種類(lèi)型的圖表組合在一起,可以圖形化顯示(圖2A )多搀。在第一個(gè)顯示(級(jí)別 1)中歧蕉,僅顯示了查詢(xún)基因之間的直接連接。第二種算法(第 2 級(jí))旨在通過(guò)包含蛋白質(zhì)來(lái)連接查詢(xún)癌癥基因康铭,這些蛋白質(zhì)通過(guò)與兩個(gè)癌癥基因相互作用惯退,允許在它們之間形成橋梁(第一個(gè)鄰居)。最后从藤,在第 3 級(jí)催跪,可以顯示數(shù)據(jù)庫(kù)中查詢(xún)基因注釋的所有邏輯交互。復(fù)選框還允許將可以從mentha數(shù)據(jù)庫(kù)檢索到的物理交互添加到網(wǎng)絡(luò)(18)夷野。一旦顯示這些圖表中的任何一個(gè)懊蒸,就可以通過(guò)添加或刪除節(jié)點(diǎn)或根據(jù)交互分?jǐn)?shù)和類(lèi)型過(guò)濾圖表來(lái)對(duì)其進(jìn)行編輯。由 FDA 批準(zhǔn)的抗癌藥物靶向的基因產(chǎn)品用青色邊框勾勒出來(lái)悯搔。通過(guò)單擊節(jié)點(diǎn)骑丸,可以通過(guò)彈出窗口中的超鏈接顯示抑制劑列表。

連接癌癥相關(guān)基因⊥ㄎ#基于圖形算法的工具提供了在基因列表中查找功能連接的可能性铸豁,這些基因列表可以由用戶(hù)定義或從癌癥基因普查或 DisGeNET 獲得。( A ) 可以得到三種類(lèi)型的圖表菊碟。在級(jí)別 1 僅顯示查詢(xún)基因之間的直接連接节芥。在第 2 級(jí),兩個(gè)查詢(xún)基因可以通過(guò)與全局因果相互作用組中的常見(jiàn)蛋白質(zhì)的因果相互作用聯(lián)系起來(lái)逆害。最后头镊,在第 3 級(jí),顯示了查詢(xún)癌癥基因的所有相互作用忍燥。( B ) 一旦顯示了這些圖表之一拧晕,就可以使用已策劃的癌癥 MiniPathways 列表來(lái)探索交叉對(duì)話。

一項(xiàng)附加功能允許計(jì)算顯示的網(wǎng)絡(luò)和數(shù)據(jù)庫(kù)中管理的癌癥 MiniPathways 之間共有的節(jié)點(diǎn)數(shù)量梅垄,并使用為 DISNOR 數(shù)據(jù)庫(kù)描述的相同程序計(jì)算重疊的統(tǒng)計(jì)顯著性 ( 19 )厂捞。這提供了推斷可能在正在審查的腫瘤特異性網(wǎng)絡(luò)中受到干擾的癌癥途徑的可能性。最后队丝,顯示的圖表和癌癥 MiniPathways 之間的串?dāng)_可以以圖形方式顯示(圖 2B)靡馁。用于生成圖表的注釋信息可以以制表符分隔的格式下載以供本地使用。

上述方法不僅限于在 CGC 和 DisGeNET 中注釋的基因列表机久,因?yàn)榭梢栽凇斑B接蛋白質(zhì)”框架中輸入任何用戶(hù)定義的基因列表臭墨,以查詢(xún)數(shù)據(jù)庫(kù)并繪制連接列表中基因的網(wǎng)絡(luò)(圖2A )。


討論

CangerGeneNet 提供給用戶(hù)探索選定基因改變的癌癥驅(qū)動(dòng)本質(zhì)的機(jī)制膘盖。這在癌癥資源全景中是獨(dú)一無(wú)二的胧弛,并且很有用,因?yàn)樗梢约ぐl(fā)新的假設(shè)進(jìn)行實(shí)驗(yàn)測(cè)試侠畔。由于 CancerGeneNet 網(wǎng)絡(luò)是定向和簽名的结缚,它的分析還允許推斷任何因果關(guān)系鏈?zhǔn)欠裼锌赡芗せ罨蛲S面湹哪┒斯?jié)點(diǎn)。人們可能會(huì)驚訝地發(fā)現(xiàn)软棺,這類(lèi)查詢(xún)的答案不是一成不變的红竭,而是取決于所考慮的具體路徑。對(duì)這些發(fā)現(xiàn)可能具有瑣碎的解釋?zhuān)渲幸恍┙Y(jié)果如下所述喘落。然而茵宪,我們還需要考慮基因/蛋白質(zhì) - 功能取決于可以在一個(gè)語(yǔ)境中歸類(lèi)為癌基因的基因的上下文和報(bào)告,而另一個(gè)語(yǔ)境中的onco-抑制劑變得越來(lái)越普遍(20-24 )瘦棋。

我們已盡最大努力確保注釋工作的高覆蓋率和準(zhǔn)確性稀火。然而,我們知道兽狭,重要的邏輯關(guān)系可能沒(méi)有引起我們的注意憾股,而其他一些關(guān)系可能被錯(cuò)誤地注釋了鹿蜀。這可以通過(guò)持續(xù)的管理和修訂工作來(lái)改進(jìn)。另一個(gè)重要的警告是服球,我們的“幼稚方法”假設(shè)蛋白質(zhì)組中的所有蛋白質(zhì)都在所有細(xì)胞中表達(dá)茴恰,因此,它可能表明連接未在特定腫瘤中表達(dá)的蛋白質(zhì)的路徑斩熊。蛋白質(zhì)組表達(dá)數(shù)據(jù)庫(kù)往枣,如人類(lèi)蛋白質(zhì)圖譜 ( 25 ) 可以幫助過(guò)濾涉及未在感興趣的生物系統(tǒng)中表達(dá)的蛋白質(zhì)的路徑。

最后粉渠,我們的模型可能不足以代表細(xì)胞信號(hào)的復(fù)雜性分冈。例如,在我們的模型中霸株,蛋白質(zhì)具有可以被刺激或抑制的“一個(gè)”功能雕沉。該模型不允許考慮蛋白質(zhì)具有可以獨(dú)立調(diào)節(jié)的兩種不同功能。例如去件,一種激酶具有兩個(gè)靶標(biāo)坡椒,其中兩種活性中只有一種受到抑制劑的調(diào)節(jié)。

將圖算法應(yīng)用于 CancerGeneNet 底層網(wǎng)絡(luò)允許實(shí)現(xiàn)與推斷改變?nèi)魏谓o定基因產(chǎn)物的表達(dá)或活性的表型影響相關(guān)的任務(wù)尤溜。在數(shù)據(jù)庫(kù)的前端倔叼,我們已經(jīng)實(shí)現(xiàn)了許多圖形算法來(lái)操作有符號(hào)的定向“癌癥圖”,以幫助完成以下任務(wù):(i)確定將任何給定基因與癌癥標(biāo)志表型聯(lián)系起來(lái)的路徑宫莱,(ii )給定一個(gè)明顯不相關(guān)的腫瘤相關(guān)基因列表丈攒,如在 CGC 或 DisGeNET 中,通過(guò)因果關(guān)系將它們連接起來(lái)授霸,(iii)給定任何用戶(hù)定義的基因列表巡验,通過(guò)因果關(guān)系將它們連接起來(lái),并將它們與癌癥的標(biāo)志聯(lián)系起來(lái)碘耳。

CancerGeneNet 的價(jià)值在于對(duì)連接癌癥相關(guān)基因的細(xì)胞因果網(wǎng)絡(luò)的無(wú)偏見(jiàn)覆蓋深碱,而不會(huì)對(duì)相關(guān)的因果關(guān)系產(chǎn)生太大偏見(jiàn)。因此藏畅,該資源能夠提供新穎的假設(shè)。然而功咒,應(yīng)該記住愉阎,生物學(xué)比圖論更復(fù)雜,資源輸出應(yīng)該被視為建議力奋,并由專(zhuān)家癌癥生物學(xué)家進(jìn)行嚴(yán)格過(guò)濾榜旦。

最后,我們策劃工作的一個(gè)意想不到的結(jié)果是發(fā)現(xiàn)景殷,對(duì)于多達(dá) 20% 的癌癥基因溅呢,我們對(duì)其致瘤功能的分子機(jī)制知之甚少澡屡。

許多資源都集中在癌癥信號(hào)通路上(15、26咐旧、27)驶鹉。然而,據(jù)我們所知铣墨,人工注釋的信息內(nèi)容和可以使用 CancerGeneNet 完成的任務(wù)是任何其他公共資源都無(wú)法比擬的室埋。CancerGeneNet 提供了一種獨(dú)特的工具,可以彌合基因組數(shù)據(jù)和癌癥表型之間的差距伊约。


數(shù)據(jù)可用性

CancerGeneNet 可在https://signor.uniroma2.it/CancerGeneNet/獲得姚淆。可以從https://signor.uniroma2.it/下載基礎(chǔ)策劃信息屡律。


參考

  1. Hutter C., Zenklusen J.C. The cancer genome Atlas: creating lasting value beyond its data. Cell. 2018; 173:283–285.

  2. Tate J.G., Bamford S., Jubb H.C., Sondka Z., Beare D.M., Bindal N., Boutselakis H., Cole C.G., Creatore C., Dawson E. et al. . COSMIC: the catalogue of somatic mutations in cancer. Nucleic Acids Res. 2019; 47:D941–D947.

  3. Sondka Z., Bamford S., Cole C.G., Ward S.A., Dunham I., Forbes S.A. The COSMIC cancer gene Census: describing genetic dysfunction across all human cancers. Nat. Rev. Cancer. 2018; 18:696–705.

  4. Davis A.P., Grondin C.J., Johnson R.J., Sciaky D., McMorran R., Wiegers J., Wiegers T.C., Mattingly C.J. The comparative toxicogenomics Database: update 2019. Nucleic Acids Res. 2019; 47:D948–D954.

  5. Gonzalez-Perez A., Perez-Llamas C., Deu-Pons J., Tamborero D., Schroeder M.P., Jene-Sanz A., Santos A., Lopez-Bigas N. IntOGen-mutations identifies cancer drivers across tumor types. Nat. Methods. 2013; 10:1081–1082.

  6. Chung I.-F., Chen C.-Y., Su S.-C., Li C.-Y., Wu K.-J., Wang H.-W., Cheng W.-C. DriverDBv2: a database for human cancer driver gene research. Nucleic Acids Res. 2016; 44:D975–D979.

  7. UniProt Consortium, T UniProt: the universal protein knowledgebase. Nucleic Acids Res. 2018; 46:2699–2699.

  8. Pi?ero J., Bravo à., Queralt-Rosinach N., Gutiérrez-Sacristán A., Deu-Pons J., Centeno E., García-García J., Sanz F., Furlong L.I DisGeNET: a comprehensive platform integrating information on human disease-associated genes and variants. Nucleic Acids Res. 2017; 45:D833–D839.

  9. Hanahan D., Weinberg R.A. Hallmarks of Cancer: the next generation. Cell. 2011; 144:646–674.

  10. Perfetto L., Briganti L., Calderone A., Perpetuini A.C., Iannuccelli M., Langone F., Licata L., Marinkovic M., Mattioni A., Pavlidou T. et al. . SIGNOR: a database of causal relationships between biological entities. Nucleic Acids Res. 2016; 44:D548–D554.

  11. Sun J., Wei Q., Zhou Y., Wang J., Liu Q., Xu H. A systematic analysis of FDA-approved anticancer drugs. BMC Syst. Biol. 2017; 11:87.

  12. Calderone A., Cesareni G. SPV: a JavaScript Signaling Pathway Visualizer. Bioinformatics. 2018; 34:2684–2686.

  13. Csárdi G., N.T. The igraph software package for complex network research. Inter. J. Comp. Syst. 2006; 1695:1–9.

  14. Hagberg A.A., Schult D.A., Swart P.J. Exploring network structure, dynamics, and function using NetworkX. Proceedings of the 7th Python in Science Conference. 2008; SciPy 200811–16.

  15. Fabregat A., Jupe S., Matthews L., Sidiropoulos K., Gillespie M., Garapati P., Haw R., Jassal B., Korninger F., May B. et al. . The reactome pathway knowledgebase. Nucleic Acids Res. 2018; 46:D649–D655.

  16. Franz M., Lopes C.T., Huck G., Dong Y., Sumer O., Bader G.D. Cytoscape.js: a graph theory library for visualisation and analysis. Bioinformatics. 2015; 32:btv557.

  17. Perfetto L., Acencio M.L., Bradley G., Cesareni G., Del Toro N., Fazekas D., Hermjakob H., Korcsmaros T., Kuiper M., L?greid A. et al. . CausalTAB:the PSI-MITAB2.8updated format for signalling data representation and dissemination. Bioinformatics. 2019; 35:3779–3785.

  18. Calderone A., Castagnoli L., Cesareni G. mentha: a resource for browsing integrated protein-interaction networks. Nat. Methods. 2013; 10:690–691.

  19. Lo Surdo P., Calderone A., Iannuccelli M., Licata L., Peluso D., Castagnoli L., Cesareni G., Perfetto L. DISNOR: a disease network open resource. Nucleic Acids Res. 2018; 46:D527–D534.

  20. Williams T.M., Lisanti M.P. Caveolin-1 in oncogenic transformation, cancer, and metastasis. Am. J. Physiol. Physiol. 2005; 288:C494–C506.

  21. Eskelinen E.-L. The dual role of autophagy in cancer. Curr. Opin. Pharmacol. 2011; 11:294–300.

  22. Bard-Chapeau E.A., Li S., Ding J., Zhang S.S., Zhu H.H., Princen F., Fang D.D., Han T., Bailly-Maitre B., Poli V. et al. . Ptpn11/Shp2 acts as a tumor suppressor in hepatocellular carcinogenesis. Cancer Cell. 2011; 19:629–639.

  23. Liu H., Wu Y., Zhu S., Liang W., Wang Z., Wang Y., Lv T., Yao Y., Yuan D., Song Y. PTP1B promotes cell proliferation and metastasis through activating src and ERK1/2 in non-small cell lung cancer. Cancer Lett. 2015; 359:218–225.

  24. Neel J.-C., Humbert L., Lebrun J.-J. The dual role of TGFβ in human Cancer: From tumor suppression to cancer metastasis. ISRN Mol. Biol. 2012; 2012:1–28.

  25. Uhlen M., Zhang C., Lee S., Sj?stedt E., Fagerberg L., Bidkhori G., Benfeitas R., Arif M., Liu Z., Edfors F. et al. . A pathology atlas of the human cancer transcriptome. Science. 2017; 357:eaan2507.

  26. Kuperstein I., Bonnet E., Nguyen H.-A., Cohen D., Viara E., Grieco L., Fourquet S., Calzone L., Russo C., Kondratova M. et al. . Atlas of Cancer Signalling Network: a systems biology resource for integrative analysis of cancer data with Google Maps. Oncogenesis. 2015; 4:e160.

  27. Kanehisa M., Furumichi M., Tanabe M., Sato Y., Morishima K. KEGG: new perspectives on genomes, pathways, diseases and drugs. Nucleic Acids Res. 2017; 45:D353–D361.

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末腌逢,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子超埋,更是在濱河造成了極大的恐慌搏讶,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,013評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件纳本,死亡現(xiàn)場(chǎng)離奇詭異窍蓝,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)繁成,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門(mén)吓笙,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人巾腕,你說(shuō)我怎么就攤上這事面睛。” “怎么了尊搬?”我有些...
    開(kāi)封第一講書(shū)人閱讀 152,370評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵叁鉴,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我佛寿,道長(zhǎng)幌墓,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 55,168評(píng)論 1 278
  • 正文 為了忘掉前任冀泻,我火速辦了婚禮常侣,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘弹渔。我一直安慰自己胳施,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評(píng)論 5 371
  • 文/花漫 我一把揭開(kāi)白布肢专。 她就那樣靜靜地躺著舞肆,像睡著了一般焦辅。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上椿胯,一...
    開(kāi)封第一講書(shū)人閱讀 48,954評(píng)論 1 283
  • 那天筷登,我揣著相機(jī)與錄音,去河邊找鬼压状。 笑死仆抵,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的种冬。 我是一名探鬼主播镣丑,決...
    沈念sama閱讀 38,271評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼娱两!你這毒婦竟也來(lái)了莺匠?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 36,916評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤十兢,失蹤者是張志新(化名)和其女友劉穎趣竣,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體旱物,經(jīng)...
    沈念sama閱讀 43,382評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡遥缕,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了宵呛。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片单匣。...
    茶點(diǎn)故事閱讀 37,989評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖宝穗,靈堂內(nèi)的尸體忽然破棺而出户秤,到底是詐尸還是另有隱情,我是刑警寧澤逮矛,帶...
    沈念sama閱讀 33,624評(píng)論 4 322
  • 正文 年R本政府宣布鸡号,位于F島的核電站,受9級(jí)特大地震影響须鼎,放射性物質(zhì)發(fā)生泄漏鲸伴。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評(píng)論 3 307
  • 文/蒙蒙 一晋控、第九天 我趴在偏房一處隱蔽的房頂上張望挑围。 院中可真熱鬧,春花似錦糖荒、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 30,199評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)蜘矢。三九已至,卻和暖如春综看,著一層夾襖步出監(jiān)牢的瞬間品腹,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 31,418評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工红碑, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留舞吭,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,401評(píng)論 2 352
  • 正文 我出身青樓析珊,卻偏偏與公主長(zhǎng)得像羡鸥,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子忠寻,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容