主要來源于諾禾公司文件學(xué)習(xí)筆記喇闸,略有修改懦窘,侵權(quán)刪!
1)蛋白功能注釋
目前提供注釋的通用功能數(shù)據(jù)庫主要有 GO婶恼、KEGG桑阶、COG 等。通過利用這些數(shù)據(jù)庫對(duì)鑒定到的蛋白質(zhì)進(jìn)行功能注釋熙尉,以了解不同蛋白質(zhì)的功能特性联逻,數(shù)據(jù)庫注釋結(jié)果統(tǒng)計(jì)見下圖。功能注釋基本步驟如下:
GO:GO 注釋是將鑒定到的蛋白質(zhì)利用 interproscan 軟件進(jìn)行分析检痰,該軟件涉及6 大知名數(shù)據(jù)庫(Pfam包归,PRINTS, ProDom铅歼,SMART公壤, ProSite, PANTHER)的搜索椎椰,因此會(huì)使得注釋的結(jié)果更加全面厦幅。
KEGG、COG:
1) KEGG慨飘、COG 注釋是將鑒定到的蛋白質(zhì)進(jìn)行 BLAST 比對(duì)(blastp确憨,evalue ≤ 1e-4);
2) BLAST 結(jié)果過濾:對(duì)于每一條序列的 BLAST 結(jié)果瓤的,選取 score 最高的比對(duì)結(jié)果進(jìn)行注釋(圖 1休弃,2)。結(jié)構(gòu)域注釋(IPR)也用 interproscan 軟件進(jìn)行圈膏,包括 PfamProDom塔猾,SMART等結(jié)構(gòu)域的數(shù)據(jù)庫,利用模式結(jié)構(gòu)或特征進(jìn)行功能未知蛋白的結(jié)構(gòu)域注釋(圖3)稽坤。
2)蛋白差異分析
Proteome Discoverer2.2 首先計(jì)算每個(gè) PSM 的各 marker 對(duì)間的比值丈甸,然后對(duì)每個(gè)蛋白質(zhì)包含的所有 unique 肽段的比值進(jìn)行加權(quán)求平均值糯俗,作為該蛋白的對(duì)應(yīng) marker 對(duì)的比值。最后將待比較的不同樣品的所有生物重復(fù)兩兩比較所得比值取中位數(shù)睦擂,作為最終樣品間的差異倍數(shù)(Fold Change得湘,F(xiàn)C)。將每個(gè)蛋白在兩個(gè)比較對(duì)樣品中的相對(duì)定量值進(jìn)行了 T-test 檢驗(yàn)祈匙,并計(jì)算相應(yīng)的 p-value忽刽,以此作為顯著性指標(biāo)天揖。當(dāng) FC≥1.5夺欲,同時(shí) p-value≤0.05 時(shí),蛋白表現(xiàn)為表達(dá)量顯著差異(圖 4)今膊。
對(duì)每個(gè)樣品中蛋白相對(duì)含量進(jìn)行聚類分析(圖 5)些阅,利用聚類熱圖觀察不同蛋白在不同樣品間比較時(shí)的上調(diào)、下調(diào)情況斑唬。每行進(jìn)行了 Z 值校正,(觀測(cè)值-行均值)/行標(biāo)準(zhǔn)差市埋。
3)差異蛋白富集分析
將差異蛋白篩選出來后,差異蛋白數(shù)目相對(duì)較多恕刘,分析目標(biāo)不明確缤谎,通過差異蛋白富集分析,可以將差異蛋白富集到參與的生物學(xué)功能或細(xì)胞通路中褐着,從而給出差異蛋白質(zhì)與哪些生物學(xué)功能顯著相關(guān)或確定差異蛋白參與的最主要生化代謝途徑和信號(hào)轉(zhuǎn)導(dǎo)途徑坷澡。結(jié)構(gòu)域富集分析,該功能或者定位有可能與造成差異的原因有關(guān)含蓉。
GO 功能顯著性富集分析給出與所有鑒定到的蛋白質(zhì)背景相比频敛,差異蛋白質(zhì)中顯著富集的 GO 功能條目,從而給出差異蛋白質(zhì)與哪些生物學(xué)功能顯著相關(guān)馅扣。
該分析首先把所有差異蛋白質(zhì)向 Gene Ontology 數(shù)據(jù)庫
(http://www.geneontology.org/)的各個(gè) term 映射斟赚,計(jì)算每個(gè) term 的蛋白質(zhì)數(shù)目,然后應(yīng)用超幾何檢驗(yàn)差油,找出與所有蛋白質(zhì)背景相比拗军,在差異蛋白質(zhì)中顯著富集的 GO 條目(圖 6)。
圖 6 GO 富集柱狀圖
KEGG Pathway 顯著性富集分析方法同 GO 功能富集分析蓄喇,是以 KEGG Pathway 為單位发侵,應(yīng)用超幾何檢驗(yàn),找出與所有鑒定到蛋白背景相比公罕,在差異蛋白中顯著性富集的 Pathway器紧。通過 Pathway 顯著性富集能確定差異蛋白參與的最主要生化代謝途徑和信號(hào)轉(zhuǎn)導(dǎo)途徑(圖 7)。
圖 7KEGG 富集氣泡圖
4)差異蛋白互作分析
利用 StringDB 蛋白質(zhì)互作數(shù)據(jù)庫(http://string-db.org/)進(jìn)行鑒定蛋白的互作分析楼眷,若在數(shù)據(jù)庫中有相應(yīng)的物種铲汪,則直接提取相應(yīng)物種的序列熊尉,若無,則提取近源物種的序列掌腰,然后將差異蛋白的序列與提取出的序列進(jìn)行 blast 比對(duì)狰住,得出相應(yīng)的互作信息,構(gòu)建網(wǎng)絡(luò)圖齿梁,網(wǎng)絡(luò)圖的例圖見圖 8催植。
圖 8 差異蛋白互作網(wǎng)絡(luò)圖