GeneWalk 基因通路分析

高通量功能基因組學的分析每次能得到成百上千的基因和大量的通路硝拧,要在這大量的基因和通路里分析出生物學意義上更重要的部分很依賴于個人的經驗和知識融欧,尤其是許多的基因都是多功能的同规。GeneWalk 利用深度學習從整合的數(shù)據(jù)庫分析出單個基因在特定研究條件下的功能信息

GeneWalk 分析流程如下圖争剿。輸入數(shù)據(jù)是一個基因列表(比如說差異基因)姆吭,首先基于數(shù)據(jù)庫(INDRA)構建基因及通路網(wǎng)絡(Gene Network)榛做,并且用 Pathway Commons 構建只有基因的網(wǎng)絡,然后再給網(wǎng)絡添加上 GO 節(jié)點形成 GeneWalk network(GWN). 然后是 DeepWalk 算法對 GWN 進行隨機游走(Random Walk)得到網(wǎng)絡節(jié)點的向量表示内狸,節(jié)點對的相似度等于相應節(jié)點向量之間的余弦相似度检眯。然后進行統(tǒng)計檢驗,計算基因與 GO 通路的關系顯著性昆淡,并進行多重檢驗(所有的基因與通路)的 P 值調整锰瘸。

圖 A 和 B 是網(wǎng)絡構建,圖 C 是 DeepWalk 分析和統(tǒng)計檢驗

GeneWalk 安裝和使用

GeneWalk 是 Python 模塊昂灵,使用 pip 命令直接安裝避凝。

pip install genewalk

安裝后先下載需要的資源,會下載到家目錄眨补。

python -m genewalk.resources

使用時僅需要提供一個基因列表(每個基因一行)文件管削,比如說提供差異基因列表。

GeneWalkDir=~/Examples/GeneWalk
genewalk --project GSE117765 --genes ${GeneWalkDir}/DEGsList.txt \
--id_type entrez_human --base_folder ${GeneWalkDir} --nproc 4

GeneWalk 分析結果

GeneWalk 所有的結果將輸出到 --base_folder 參數(shù)指定的目錄撑螺。最主要的結果文件是 genewalk_results.csv 里面包含了每個基因和注釋到的通路數(shù)據(jù)含思。其中 global_padj 是對所有的“基因-通路”對進行多重統(tǒng)計檢驗校正后的 P 值;而 gene_padj 是對該基因的所有“基因-通路”對進行校正的 P 值甘晤;pval 是初始的 P 值含潘。

文本的結果非常詳細但是不夠直觀

每個基因還會生成條形圖,直觀方便线婚。


紅線是軟件默認的 P 值閾值 —— 0.1

為了方便鑒定重要的轉錄調節(jié)基因(Regulator)會生成下圖所示的散點圖遏弱。每個點是一個基因,散點大小表示注釋到的 GO 通路數(shù)目酌伊,X 軸表示與其他基因連接數(shù)目腾窝,Y 軸表示注釋到的 GO 通路中顯著的通路占比,默認是一個基因調整后 P 值小于 0.1 的通路數(shù)目比該基因注釋到總基因數(shù)目居砖。


越右上方的點就越可能是重要的 Regulator

另一個散點圖用于鑒定 moonlight gene(多功能基因)虹脯。散點圖 X 軸為注釋的 GO 通路數(shù)目。散點大小為與其他基因連接數(shù)目奏候。


越右下的點越可能是行使了多功能的基因

上面 2 個散點圖把鼠標放到點上就會顯示該基因的數(shù)據(jù)循集,同時軟件也提供了標記了基因名的 PDF 版本,結合自己的課題需要蔗草,就能更容易從眾多的基因和通路中定位到關鍵的基因和通路咒彤。

當然了疆柔,工具永遠不是目的,用 GeneWalk 得到這些結果后還是要結合課題進行分析镶柱,只是提供另一種角度旷档,還是需要多技術多角度去綜合思考。

參考文獻
Ietswaart R, Gyori BM, Bachman JA, Sorger PK, Churchman LS. GeneWalk identifies relevant gene functions for a biological context using network representation learning. Genome Biol. 2021 Feb 2;22(1):55. doi: 10.1186/s13059-021-02264-8. PMID: 33526072.

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末歇拆,一起剝皮案震驚了整個濱河市鞋屈,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌故觅,老刑警劉巖厂庇,帶你破解...
    沈念sama閱讀 218,941評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異输吏,居然都是意外死亡权旷,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評論 3 395
  • 文/潘曉璐 我一進店門贯溅,熙熙樓的掌柜王于貴愁眉苦臉地迎上來拄氯,“玉大人,你說我怎么就攤上這事它浅±ば埃” “怎么了?”我有些...
    開封第一講書人閱讀 165,345評論 0 356
  • 文/不壞的土叔 我叫張陵罚缕,是天一觀的道長。 經常有香客問我怎静,道長邮弹,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,851評論 1 295
  • 正文 為了忘掉前任蚓聘,我火速辦了婚禮腌乡,結果婚禮上,老公的妹妹穿的比我還像新娘夜牡。我一直安慰自己与纽,他們只是感情好,可當我...
    茶點故事閱讀 67,868評論 6 392
  • 文/花漫 我一把揭開白布塘装。 她就那樣靜靜地躺著急迂,像睡著了一般。 火紅的嫁衣襯著肌膚如雪蹦肴。 梳的紋絲不亂的頭發(fā)上僚碎,一...
    開封第一講書人閱讀 51,688評論 1 305
  • 那天,我揣著相機與錄音阴幌,去河邊找鬼勺阐。 笑死卷中,一個胖子當著我的面吹牛,可吹牛的內容都是我干的渊抽。 我是一名探鬼主播蟆豫,決...
    沈念sama閱讀 40,414評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼懒闷!你這毒婦竟也來了十减?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,319評論 0 276
  • 序言:老撾萬榮一對情侶失蹤毛雇,失蹤者是張志新(化名)和其女友劉穎嫉称,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體灵疮,經...
    沈念sama閱讀 45,775評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡织阅,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了震捣。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片荔棉。...
    茶點故事閱讀 40,096評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖蒿赢,靈堂內的尸體忽然破棺而出润樱,到底是詐尸還是另有隱情,我是刑警寧澤羡棵,帶...
    沈念sama閱讀 35,789評論 5 346
  • 正文 年R本政府宣布壹若,位于F島的核電站,受9級特大地震影響皂冰,放射性物質發(fā)生泄漏店展。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,437評論 3 331
  • 文/蒙蒙 一秃流、第九天 我趴在偏房一處隱蔽的房頂上張望赂蕴。 院中可真熱鬧,春花似錦舶胀、人聲如沸概说。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽糖赔。三九已至,卻和暖如春轩端,著一層夾襖步出監(jiān)牢的瞬間挂捻,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評論 1 271
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留刻撒,地道東北人骨田。 一個月前我還...
    沈念sama閱讀 48,308評論 3 372
  • 正文 我出身青樓,卻偏偏與公主長得像声怔,于是被迫代替她去往敵國和親态贤。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,037評論 2 355

推薦閱讀更多精彩內容