Human Protein Atlas(簡稱HPA)數(shù)據(jù)庫(https://www.proteinatlas.org/),2003年由瑞典 Knut & Alice Wallenberg基金會創(chuàng)建媒区,它致力于提供全部24000多種人類蛋白質(zhì)的組織和細(xì)胞分布信息驼仪,檢查每一種蛋白質(zhì)在多種人類正常組織、腫瘤組織袜漩、細(xì)胞系和血液細(xì)胞內(nèi)的分布和表達(dá)情況绪爸,其結(jié)果用免疫組化染色圖表示,并有專業(yè)人員標(biāo)引宙攻。資源中的所有數(shù)據(jù)都開放訪問奠货。
那HPA數(shù)據(jù)庫都有什么內(nèi)容呢?接下來請跟著小編的節(jié)奏我們來了解一下HPA數(shù)據(jù)庫座掘。首先递惋,我們在搜索欄輸入目的基因或蛋白(以TP53為例)。
搜索跳轉(zhuǎn)新的頁面溢陪,包括對該基因或蛋白的描述萍虽,以及證據(jù)可靠性等級和各種圖譜結(jié)果(Tissue、Brain形真、Single cell杉编、Pathology、Disease、Immune王财、Blood卵迂、Subcell、Cell line绒净、Structure见咒、Interaction)。每個圖譜都有圓形標(biāo)識挂疆,完整圓形表明證據(jù)級別最高(enhanced)改览,其次是3/4(supported),1/2(approved)缤言,1/4(uncertain)宝当,N/A表示目前無相關(guān)數(shù)據(jù)或相關(guān)數(shù)據(jù)較少。
選擇目標(biāo)基因/蛋白后胆萧,能看到基因/蛋白的“Summary”欄信息庆揩,包括基因/蛋白的基礎(chǔ)信息,蛋白表達(dá)和定位信息跌穗、組織RNA表達(dá)信息订晌、免疫細(xì)胞的特異性和表達(dá)簇、癌癥的預(yù)后及特異性蚌吸、細(xì)胞系相關(guān)信息锈拨、血液中的蛋白質(zhì)信息及蛋白質(zhì)功能信息。
在左側(cè)的“ANTIBODY DATA”中可以查閱抗體和干擾RNA的表達(dá)情況羹唠。The Human Pathology Atlas數(shù)據(jù)庫中的蛋白質(zhì)奕枢,都有對應(yīng)抗體的上百張不同實(shí)驗(yàn)類型驗(yàn)證結(jié)果圖,包含IHC佩微、WB缝彬、IF等。
一些比較常用的專欄
“TISSUE”欄喊衫,主要包括一般信息(基因名稱跌造,描述,蛋白分類族购,預(yù)測位置,轉(zhuǎn)錄本數(shù)目)陵珍,蛋白圖譜信息(RNA表達(dá)組織特異性寝杖,RNA表達(dá)組織分布,蛋白證據(jù)等級互纯,蛋白表達(dá)定位)瑟幕,免疫組化數(shù)據(jù)可靠性(數(shù)據(jù)可靠性,評分,相應(yīng)抗體)只盹。
下拉頁面我們能發(fā)現(xiàn)RNA和蛋白表達(dá)圖譜辣往,按照人體器官分布,左側(cè)顯示的是RNA表達(dá)殖卑,右側(cè)是蛋白的表達(dá)站削。我們能發(fā)現(xiàn)該基因/蛋白在不同的性別的不同器官表達(dá)量有差異。
點(diǎn)擊也可以查看到基因/蛋白在不同系統(tǒng)中的器官中的表達(dá)情況孵稽。
HPA整理并提供了三個轉(zhuǎn)錄組學(xué)數(shù)據(jù)许起,分別是HPA,GTEx菩鲜,和Consensus园细。
HPA也整理并提供查閱不同抗體在不同器官中的適用性數(shù)據(jù)資料,方便我們在實(shí)驗(yàn)設(shè)計前選擇合適的抗體接校。
“PATHOLOGY”欄猛频,存在General information, Human protein atlas information蛛勉, 可以選擇不同的腫瘤伦乔,每個腫瘤類型提供數(shù)十個病人的年齡、性別董习、人種烈和、癌癥階段、預(yù)后時間皿淋,以及生存散點(diǎn)圖招刹、生存分析、對應(yīng)的腫瘤組織IHC染色結(jié)果圖等信息窝趣。
同時該專欄還會有不同的組織器官/腫瘤組織的IHC的染色結(jié)果圖疯暑,如果在工作中沒有做臨床樣本實(shí)驗(yàn),很多文章也會引用摘錄這里的結(jié)果作為佐證哑舒。
“SUBCELL”欄妇拯,存在General information,Human protein atlas information洗鸵,Single cell types以及Single cell tissue越锈。在這個專欄里我們能看到該蛋白在細(xì)胞中的表達(dá)位置。
我們可以查閱基因/蛋白在不同系統(tǒng)中細(xì)胞系中表達(dá)情況(后面也有Cell line專欄)膘滨。
Subcell能夠告訴我們基因表達(dá)的空間位置以及表達(dá)強(qiáng)度甘凭。
siRNA相關(guān)能告訴我們RNA干擾后的表達(dá)水平,能作為生信分析時濕實(shí)驗(yàn)驗(yàn)證的數(shù)據(jù)補(bǔ)充火邓。
“CELL LINE”欄丹弱,能看到該基因/蛋白在不同的組織中不同細(xì)胞系的RNA表達(dá)量德撬。但不如CCLE詳細(xì),如何更優(yōu)的選擇實(shí)驗(yàn)所用的細(xì)胞系躲胳,后續(xù)小編也會介紹給大家蜓洪。
“STRUCTURE”欄,主要展示了TP53的基本信息坯苹,此處還提供了一些有用的外鏈數(shù)據(jù)庫隆檀,比如Uniprot數(shù)據(jù)庫,便于快速查詢TP53的其它關(guān)鍵信息北滥,如氨基酸序列刚操、長度、蛋白功能和二再芋、三級結(jié)構(gòu)等菊霜。
“INTERACTION”欄,收錄了與目標(biāo)蛋白相互作用的各種蛋白济赎,十分齊全鉴逞。同時進(jìn)行了直接作用和間接作用分類,作用級別排序司训,甚至對互作的所有蛋白按照定位构捡、組織特異性和蛋白類型進(jìn)行分類標(biāo)注。
HPA數(shù)據(jù)庫網(wǎng)站列出了蛋白抗體的詳細(xì)信息壳猜,包括供應(yīng)商(Sigma-Aldrich)勾徽、來源物種(兔/鼠)、單/多抗统扳、純化方法等喘帚。提供了每種抗體已有的具體實(shí)驗(yàn)結(jié)果,包括免疫熒光咒钟、免疫組化和WB等吹由,這些信息可為大家選擇抗體提供指導(dǎo)。提供了細(xì)胞尺度下的蛋白表達(dá)情況朱嘴,其中比較關(guān)鍵的信息是蛋白在不同細(xì)胞類群倾鲫、以及同一細(xì)胞內(nèi)的空間分布情況,這些數(shù)據(jù)以免疫檢測實(shí)驗(yàn)結(jié)果展示萍嬉,為后續(xù)實(shí)驗(yàn)參考提供了極大的便利乌昔。
HPA數(shù)據(jù)庫的內(nèi)容太豐富了,今天分享的只是數(shù)據(jù)庫的一小部分內(nèi)容帚湘,其它部分還請大家自行探索喲玫荣,后續(xù)我們還會分享更多的關(guān)于HPA數(shù)據(jù)庫的功能,包括如何使用HPA數(shù)據(jù)庫進(jìn)行文章實(shí)驗(yàn)補(bǔ)充大诸。