背景知識
細(xì)胞內(nèi)蛋白質(zhì)組豐度的動態(tài)變化對不同生命過程有重要影響俱诸。例如在許多疾病的發(fā)生和發(fā)展進(jìn)程中沸手,常常伴隨著某些蛋白質(zhì)的表達(dá)異常。目前定量蛋白質(zhì)組學(xué)技術(shù)主要分為標(biāo)記(label)策略和非標(biāo)記的(label free)定量策略,其中標(biāo)記策略又分為體內(nèi)標(biāo)記(如 SILAC、15N 標(biāo)記)睛竣,以及體外標(biāo)記(如 iTRAQ、TMT 標(biāo)記) 求摇。
非標(biāo)記定量(label-free)蛋白質(zhì)組學(xué)技術(shù)是通過液質(zhì)聯(lián)用技術(shù)對蛋白質(zhì)酶解肽段進(jìn)行質(zhì)譜分析射沟,該技術(shù)不需要使用昂貴的穩(wěn)定同位素標(biāo)簽做內(nèi)部標(biāo)準(zhǔn),只需分析大規(guī)模鑒定蛋白質(zhì)時(shí)所產(chǎn)生的質(zhì)譜數(shù)據(jù)与境,比較不同樣品中相應(yīng)肽段的信號強(qiáng)度验夯,從而對肽段對應(yīng)的蛋白質(zhì)進(jìn)行相對定量。
軟件
轉(zhuǎn)換
賽默飛的raw數(shù)據(jù)格式需要轉(zhuǎn)換摔刁,可以使用MSconvert或ThermoRawFileParser等軟件挥转。
在獲取圖譜過程中,常會用到2018年才推出的FAIMS(High-Field Asymmetric Waveform Ion Mobility Spectrometry)技術(shù)以用于加載不同電壓(肽段在ESI離子化后共屈,進(jìn)入質(zhì)譜之前實(shí)現(xiàn)快速氣相分離绑谣,提高分離的峰容量),直接使用多電壓下的raw data做MaxQuant定量分析是錯誤的拗引,MaxQuant軟件只能識別單電壓的raw data借宵,因此需要使用FAIMS MzXML Generator 軟件將raw data轉(zhuǎn)換成各自電壓下的MzXML文件。
質(zhì)控
IQuant 原華大質(zhì)譜組員工聞博撰寫矾削,其輸入MGF文件基于Mascot(收費(fèi)軟件)壤玫。
搜庫
MaxQuant豁护,MSGFplus,Comet欲间。前一個最好用win版本择镇,后兩個用linux版本,然后后兩個是最好用主流的質(zhì)控軟件括改。
收費(fèi)軟件:Proteome Discoverer腻豌, Mascot。
后期處理
Percolator
Perseus
評估質(zhì)譜數(shù)據(jù)
第一種是實(shí)驗(yàn)手段嘱能,用MALDI-TOF預(yù)先評估樣本的蛋白含量水平吝梅。
第二種就是直接做完鑒定之后看譜圖識別率或者蛋白CV。
proteoQC
該軟件結(jié)合參考蛋白質(zhì)數(shù)據(jù)庫惹骂,對MGF(Mascot Generic Format files)格式的文件進(jìn)行質(zhì)控處理苏携,最后得到多個質(zhì)控信息。
搜索數(shù)據(jù)庫選擇
不關(guān)注變異蛋白質(zhì)可以使用Human data was queried against the UniProt’s Complete HUMAN proteome对粪;否則需要根據(jù)特定組織類型選擇對應(yīng)的背景數(shù)據(jù)庫找到變異蛋白右冻。
- uniprot/swissprot只包含非變異序列 ;
- 患者的測序數(shù)據(jù)組裝之后翻譯成蛋白做ref著拭;
下游分析
分析蛋白質(zhì)表達(dá)譜纱扭,建議使用LFQ或iBAQ intensity,不建議直接使用intensity儡遮。
- Protein intensity. For protein groups, this is the sum of all identified peptide intensities for the group. Peptide-feature intensities are taken at the peak maximum over the elution profile and include all isotopic peaks.
- LFQ intensity. This is the relative protein quantification across all samples, and is represented by a normalized intensity profile that is generated according to the algorithms described in Cox et al. The LFQ intensities will form a matrix with the number of samples and number of protein groups as dimensions.
- iBAQ protein intensity. Intensity-based absolute quantification is an approximation of protein copy numbers based on the sum of peptide-feature intensities of all peptides matching to a protein divided by the number of theoretically observable peptides.