一文掌握GO和pathway分析

非原創(chuàng)
參考資料:
一文掌握GO和pathway分析 - 生物信息學(xué)討論版 -丁香園論壇
http://www.dxy.cn/bbs/thread/34904124#34904124

一. GO富集

GO是Gene ontology的縮寫舌厨,GO數(shù)據(jù)庫分別從功能载慈、參與的生物途徑及細(xì)胞中的定位對(duì)基因產(chǎn)物進(jìn)行了標(biāo)準(zhǔn)化描述赊级,即對(duì)基因產(chǎn)物進(jìn)行簡(jiǎn)單注釋漱挚,通過GO富集分析可以粗略了解差異基因富集在哪些生物學(xué)功能蜕提、途徑或者細(xì)胞定位。

二. Pathway
Pathway指代謝通路历恐,對(duì)差異基因進(jìn)行pathway分析角寸,可以了解實(shí)驗(yàn)條件下顯著改變的代謝通路,在機(jī)制研究中顯得尤為重要死相。

GO分析好比是將基因分門別類放入一個(gè)個(gè)功能類群的籃子融求,而pathway則是將基因一個(gè)個(gè)具體放到代謝網(wǎng)絡(luò)中的指定位置。

三. 文章案例

Identification of a novel biomarker, SEMA5A, for non-small celllung carcinoma in nonsmoking women
相關(guān)基因:SEMA5A
相關(guān)疾菜愦椤:Carcinoma,Non-Small-Cell Lung;Lung Neoplasms
PMID: 20802022 影響因子3.622 GEO 相關(guān)樣本:120

  文章作者使用AffymetrixU133plus2.0芯片1檢測(cè)了臺(tái)灣地區(qū)非吸煙肺癌女性患者60對(duì)癌癥和癌旁肺組織樣本生宛,利用配對(duì)T檢驗(yàn)篩選了腫瘤組織中687個(gè)差異表達(dá)基因2施掏,并且利用逆轉(zhuǎn)錄PCR和免疫組化進(jìn)行了驗(yàn)證。如何將687個(gè)縮小范圍呢?因此我們需要判斷差異基因在肺癌細(xì)胞中主要富集在哪些功能類群和代謝通路茅糜。
  文章作者利用IPA(IngenuityPathway Analysis)軟件對(duì)差異基因進(jìn)行了功能分析,篩選出了16條顯著性代謝通路3素挽。在最顯著改變的三條通路中蔑赘,其中兩條都和軸突導(dǎo)向信號(hào)通路(axonguidance)相關(guān),作者很意外预明,于是就選定了軸突導(dǎo)向信號(hào)通路缩赛,并在其中挑選了差異表達(dá)倍數(shù)最高的SEMA5A基因作為后續(xù)的研究對(duì)象。
 作者最后利用kaplan-Meier生存分析證明了SEMA5A基因的低表達(dá)和非吸煙女性肺癌的低生存率有關(guān)聯(lián)撰糠,其可能成為非小細(xì)胞肺癌預(yù)后的一個(gè)有效的生物標(biāo)志物酥馍,也可能代表臺(tái)灣地區(qū)病人的性別特異性。

四.文章思路

1.找到差異表達(dá)基因阅酪;
2.通過功能分析進(jìn)一步縮小差異基因范圍旨袒;
3.有針對(duì)性的挑選基因;

1.目的:找到差異表達(dá)基因术辐。
方法:基因差異表達(dá)分析流程

2.目的:縮小差異基因范圍砚尽。
方法:功能分析(GO、KEGG分析等)

3.目的:有針對(duì)性的選基因辉词。
方法:找最顯著必孤、最常出現(xiàn)、差異最顯著的基因瑞躺,kaplan-meie生存分析敷搪。

image

五.文章分析結(jié)果
小編利用上述案例中的數(shù)據(jù)GSE19804在GCBI在線實(shí)驗(yàn)室首先進(jìn)行差異分析(|foldchange|>2, P值<0.001Q值<0.05),得到了2202個(gè)差異基因幢哨。
將差異基因分別進(jìn)行GO(P值<0.01赡勘,F(xiàn)DR<0.01)和pathway分析(P值<0.05),富集得到351個(gè)GO term和110條pathway嘱么。
結(jié)果如下圖所示狮含,表一和表二分別為部分GO富集結(jié)果和最顯著的15條pathway分析結(jié)果。

image
image

GO和pathway分析結(jié)果中都得到了文章中選定的axonguidance這個(gè)結(jié)果(紅框)曼振。

六.結(jié)果怎么看呢****?
表頭各個(gè)參數(shù)的解釋如下几迄,其中,重點(diǎn)看三個(gè)指標(biāo)冰评,enrichment score映胁、p值和FDR。
Pathway分析主要看P值和FDR值甲雅,兩者越小越好解孙。
GO分析還可看enrichmentscore坑填,數(shù)值越大表示某個(gè)GOterm越容易受到實(shí)驗(yàn)因素的影響。

image

七. 如何定位到基因呢****?

將axonguidance中的差異表達(dá)基因全部挑選出來弛姜,列表如下脐瑰。
作者在文中挑選了顯著性最高的SEMA5A作為后續(xù)的研究對(duì)象。
在我們的分析中廷臼,當(dāng)p值小于10^-6時(shí)默認(rèn)為0苍在,按照表達(dá)倍數(shù)排列SEMA5A也排在前列,和作者的結(jié)果較吻合荠商。

image

Ps:因參數(shù)設(shè)置和文章中不同寂恬,結(jié)果僅供參考。

八 教程 GO 和 pathway分析

目前有許多GO和pathway分析軟件莱没,GO分析軟件有Avadis(商業(yè)軟件)初肉、BiNGO(開源java)、DAVID(基于web的工具)等饰躲,pathway分析有IPA和MetaCore(商業(yè)軟件)等牙咏。

但這些軟件學(xué)習(xí)成本高,且許多都是商業(yè)軟件嘹裂。有沒有一種分析方法無門檻眠寿,直接上手就可以搞定的呢?

GCBI平臺(tái),伸手黨的福音焦蘑,生信分析方法直接加載了模塊盯拱,你需要做的只是創(chuàng)建方案,拖動(dòng)模塊例嘱,單擊運(yùn)行即可狡逢。小編用樣本GSE19804演示一下,倒數(shù)10min拼卵,GO富集分析奢浑,pathway分析全搞定。

1腋腮、進(jìn)入GCBI網(wǎng)站的在線實(shí)驗(yàn)室https://www.gcbi.com.cn(需注冊(cè)才能使用)

2雀彼、建立項(xiàng)目——方案,在方案界面即寡,拖動(dòng)模塊徊哑,修改名字和參數(shù),并用連接線將模塊連接成一個(gè)方案聪富,小編建立了如下差異分析和GO和pathway分析方案莺丑。

image

3、選擇樣本數(shù)據(jù)。

樣本數(shù)據(jù)GSE19804直接來自于GCBI樣本庫梢莽,將樣本發(fā)送到在線實(shí)驗(yàn)室萧豆。點(diǎn)擊方案中樣本模塊,在樣本分組管理中選擇配對(duì)樣本昏名,選擇好相應(yīng)的對(duì)照組和實(shí)驗(yàn)組樣涮雷。Lungnormal **N為對(duì)照組,Lungcancer **T為實(shí)驗(yàn)組轻局。

image

4份殿、設(shè)置各模塊參數(shù)

差異分析 |fold change|>1.2 P值<0.05 , Q值<0.05

GO分析 分析類型生物功能分析p值<0.01 嗽交,F(xiàn)DR<0.01

Pathway分析 p值<0.05

5、運(yùn)行方案

附錄:

文獻(xiàn)技術(shù)及參數(shù):

1颂斜、檢測(cè)手段:GeneChip Human Genome U133 Plus 2.0 expression arrays (Affymetrix, Inc.)

2夫壁、差異篩選:配對(duì)t 檢驗(yàn) (P <10^-16)和Bonferroni 校正P值

3、pathway分析:IPA軟件費(fèi)希爾精確檢驗(yàn)(fisher’s exact test) P<0.5

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末沃疮,一起剝皮案震驚了整個(gè)濱河市盒让,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌司蔬,老刑警劉巖邑茄,帶你破解...
    沈念sama閱讀 206,482評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異俊啼,居然都是意外死亡肺缕,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,377評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門授帕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來同木,“玉大人,你說我怎么就攤上這事跛十⊥罚” “怎么了?”我有些...
    開封第一講書人閱讀 152,762評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵芥映,是天一觀的道長(zhǎng)洲尊。 經(jīng)常有香客問我,道長(zhǎng)奈偏,這世上最難降的妖魔是什么坞嘀? 我笑而不...
    開封第一講書人閱讀 55,273評(píng)論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮惊来,結(jié)果婚禮上姆吭,老公的妹妹穿的比我還像新娘。我一直安慰自己唁盏,他們只是感情好内狸,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,289評(píng)論 5 373
  • 文/花漫 我一把揭開白布检眯。 她就那樣靜靜地躺著,像睡著了一般昆淡。 火紅的嫁衣襯著肌膚如雪锰瘸。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,046評(píng)論 1 285
  • 那天昂灵,我揣著相機(jī)與錄音避凝,去河邊找鬼。 笑死眨补,一個(gè)胖子當(dāng)著我的面吹牛管削,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播撑螺,決...
    沈念sama閱讀 38,351評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼含思,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了甘晤?” 一聲冷哼從身側(cè)響起含潘,我...
    開封第一講書人閱讀 36,988評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎线婚,沒想到半個(gè)月后遏弱,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,476評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡塞弊,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,948評(píng)論 2 324
  • 正文 我和宋清朗相戀三年漱逸,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片游沿。...
    茶點(diǎn)故事閱讀 38,064評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡虹脯,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出奏候,到底是詐尸還是另有隱情循集,我是刑警寧澤,帶...
    沈念sama閱讀 33,712評(píng)論 4 323
  • 正文 年R本政府宣布蔗草,位于F島的核電站咒彤,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏咒精。R本人自食惡果不足惜镶柱,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,261評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望模叙。 院中可真熱鬧歇拆,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,264評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至输吏,卻和暖如春权旷,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背贯溅。 一陣腳步聲響...
    開封第一講書人閱讀 31,486評(píng)論 1 262
  • 我被黑心中介騙來泰國(guó)打工拄氯, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人它浅。 一個(gè)月前我還...
    沈念sama閱讀 45,511評(píng)論 2 354
  • 正文 我出身青樓译柏,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親姐霍。 傳聞我的和親對(duì)象是個(gè)殘疾皇子鄙麦,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,802評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容