PubChem數(shù)據(jù)庫(kù)屬于NCBI旗下地粪,截至2024年6月,該數(shù)據(jù)庫(kù)收錄11800萬(wàn)種化合物結(jié)構(gòu)信息(Compounds子庫(kù))琐谤,31800萬(wàn)種用戶(hù)上傳的化合物數(shù)據(jù)(Substance子庫(kù))蟆技,29500萬(wàn)種實(shí)驗(yàn)結(jié)果或文獻(xiàn)支持的化合物生物活性數(shù)據(jù)(BioAssay子庫(kù)),其中還包含4100萬(wàn)篇相關(guān)文獻(xiàn)和5100萬(wàn)相關(guān)專(zhuān)利斗忌,以及113242個(gè)靶基因质礼、247611個(gè)靶蛋白和241163條通路信息,引用數(shù)據(jù)來(lái)源總計(jì)995個(gè)飞蹂。
PubChem數(shù)據(jù)庫(kù)包含大量化合結(jié)構(gòu)信息、理化性質(zhì)及生物活性翻屈、毒性和安全性數(shù)據(jù)陈哑,并提供詳細(xì)的文獻(xiàn)或?qū)@С郑瑸樯镝t(yī)藥與生物化學(xué)交叉領(lǐng)域的科研人員所青睞伸眶。
查看所有的參考來(lái)源惊窖,可在主頁(yè)點(diǎn)擊‘Explore Data Sources’,即可查看所有來(lái)源信息厘贼。
數(shù)據(jù)庫(kù)核心功能
PubChem數(shù)據(jù)庫(kù)數(shù)據(jù)檢索功能有三種方式:關(guān)鍵詞檢索界酒、結(jié)構(gòu)式檢索和批量檢索。
1嘴秸、關(guān)鍵詞檢索
在主頁(yè)檢索框輸入關(guān)鍵詞進(jìn)行快速檢索毁欣,檢索詞支持輸入化合物名稱(chēng)、化學(xué)式岳掐、CAS號(hào)凭疮、SMELE碼和InchI表達(dá)式、基因名和Covid-19專(zhuān)題檢索功能串述。
下面以阿司匹林aspirin為例执解,檢索得到結(jié)果:一條最佳檢索的結(jié)果(阿司匹林單體數(shù)據(jù)),106條化合物結(jié)構(gòu)信息(包括阿司匹林單體和混合藥物數(shù)據(jù))纲酗,835條底物數(shù)據(jù)衰腌,39條通路數(shù)據(jù)次坡,2246條藥物活性數(shù)據(jù)蔓彩,7萬(wàn)多條文獻(xiàn)和專(zhuān)利。
點(diǎn)擊‘best match’下的第一條數(shù)據(jù),詳情頁(yè)中有aspirin信息概覽壶唤,包括PubChem CID、化合物結(jié)構(gòu)脆淹、化學(xué)安全分類(lèi)巾钉、分子式、同義詞坯约、分子量和數(shù)據(jù)更新時(shí)間熊咽,并提供aspirin藥理功能注釋和肝毒性信息,提供NCI Thesaurus闹丐、LiverTox和DrugBank數(shù)據(jù)庫(kù)鏈接横殴。右側(cè)欄為該頁(yè)面所展示的信息目錄。
接下來(lái)對(duì)主要的子目錄做一個(gè)簡(jiǎn)單的說(shuō)明:
Structures
展示aspirin的2D卿拴、3D和晶體結(jié)構(gòu)衫仑,右上角可下載結(jié)構(gòu)信息文件或保存圖片,可在數(shù)據(jù)庫(kù)檢索結(jié)構(gòu)類(lèi)似的化合物堕花。
Names and Identifiers
展示aspirin的各種表達(dá)式文狱、別名和標(biāo)識(shí)符。主要的信息有:
IUPAC Name為2-乙酰氧基苯甲酸(2-acetyloxybenzoic acid)
InChI=1S/C9H8O4/c1-6(10)13-8-5-3-2-4-7(8)9(11)12/h2-5H,1H3,(H,11,12)
SMILES:CC(=O)OC1=CC=CC=C1C(=O)O
提供CAS缘挽、EC瞄崇、ICSC和UNII等數(shù)據(jù)庫(kù)ID,以及各種同義詞壕曼。
若想了解具體的內(nèi)容苏研,可點(diǎn)擊右側(cè)目錄定位查看。
Chemical and Physical Properties
展示aspirin理化性質(zhì)腮郊,比如分子量摹蘑、溶解度等內(nèi)容,其中有實(shí)驗(yàn)和預(yù)測(cè)的結(jié)果轧飞。
Spectral Information
展示aspirin的光譜信息衅鹿,包括核磁共振譜、質(zhì)譜过咬、紅外紫外光譜和Raman光譜等塘安。
Related Records
可查看aspirin相關(guān)研究進(jìn)展,
Chemical Vendors
提供aspirin供應(yīng)商信息(包含61個(gè)供應(yīng)來(lái)源)援奢。
Drug and Medication Information
展示aspirin的臨床信息兼犯,包括適應(yīng)癥、WHO指南信息、藥物成分切黔、臨床試驗(yàn)和某些藥物特性及使用注意事項(xiàng)等信息砸脊。
Pharmacology and Biochemistry
展示aspirin的藥理學(xué)性質(zhì),ADEM藥代動(dòng)力學(xué)和藥物作用機(jī)制等纬霞。
Toxicity
展示aspirin的毒理學(xué)特征凌埂,包括不同物種的肝毒性、致癌性诗芜、中毒癥狀及急救措施瞳抓。
Associated Disorders and Diseases
展示來(lái)自CTD數(shù)據(jù)庫(kù)的aspirin相關(guān)疾病信息。
Literature
展示aspirin相關(guān)文獻(xiàn)(還單獨(dú)列出了化合物的與基因和疾病相關(guān)的文獻(xiàn))伏恐。
Biomolecular Interactions and Pathways
展示aspirin的靶基因孩哑、靶蛋白及3D結(jié)構(gòu)、通路翠桦、藥物相互作用和藥物食物相互作用等信息横蜒。
Biological Test Results
展示藥物活性信息。
2销凑、結(jié)構(gòu)式進(jìn)行檢索
在首頁(yè)點(diǎn)擊Draw Structure進(jìn)入檢索界面丛晌,以檢索阿司匹林為例,繪制結(jié)構(gòu)圖(如果不太會(huì)用斗幼,可以點(diǎn)擊下方Help查看繪圖指南)澎蛛。檢索結(jié)果包括同一性、相似性蜕窿、子結(jié)構(gòu)和上層結(jié)構(gòu)谋逻,進(jìn)入各化合物詳情頁(yè)面,得到的結(jié)果內(nèi)容基本與關(guān)鍵詞檢索結(jié)果類(lèi)似渠羞。
3斤贰、批量檢索
在首頁(yè)點(diǎn)擊UPLOAD ID LIST進(jìn)入檢索界面智哀,下載示例數(shù)據(jù)次询,選擇數(shù)據(jù)類(lèi)型,上傳示例數(shù)據(jù)文件瓷叫,點(diǎn)擊Search Pubchem With This List屯吊,得到檢索結(jié)果,右側(cè)可批量下載摹菠。
元素周期表
首頁(yè)點(diǎn)擊Periodic Table 進(jìn)入元素周期表盒卸,可整體上瀏覽各元素信息,點(diǎn)擊任意元素查看詳情次氨。
總的來(lái)說(shuō):
PubChem是美國(guó)國(guó)立衛(wèi)生研究院(NIH)下屬的國(guó)立生物技術(shù)信息中心(NCBI)維護(hù)的一個(gè)免費(fèi)的化學(xué)結(jié)構(gòu)數(shù)據(jù)庫(kù)蔽介,它包含了大量的化學(xué)物質(zhì)和相關(guān)生物活性數(shù)據(jù)。PubChem數(shù)據(jù)庫(kù)擁有以下特點(diǎn):
免費(fèi)和公開(kāi):PubChem是一個(gè)免費(fèi)的資源,任何人都可以訪問(wèn)和下載數(shù)據(jù)虹蓄,這促進(jìn)了科學(xué)研究和教育犀呼。
數(shù)據(jù)量巨大:PubChem包含數(shù)以百萬(wàn)計(jì)的化合物結(jié)構(gòu)和相關(guān)的生物活性數(shù)據(jù),是一個(gè)龐大的化學(xué)信息資源薇组。
標(biāo)準(zhǔn)化數(shù)據(jù):PubChem提供了標(biāo)準(zhǔn)化的化學(xué)結(jié)構(gòu)數(shù)據(jù)外臂,有助于研究者進(jìn)行一致性和可比較性分析。
生物活性數(shù)據(jù):除了化學(xué)結(jié)構(gòu)信息律胀,PubChem還提供了化合物的生物活性數(shù)據(jù)宋光,如半數(shù)抑制濃度(IC50)等。
搜索和分析工具:PubChem提供了強(qiáng)大的搜索工具和分析功能炭菌,幫助用戶(hù)查找和分析化學(xué)結(jié)構(gòu)罪佳。
結(jié)構(gòu)多樣性:PubChem數(shù)據(jù)庫(kù)中化合物的結(jié)構(gòu)多樣,覆蓋了廣泛的化學(xué)類(lèi)型和類(lèi)別娃兽。
更新頻率高:PubChem定期更新菇民,包括新增化合物和更新現(xiàn)有數(shù)據(jù)。
與其他數(shù)據(jù)庫(kù)的鏈接:PubChem與NCBI的其他數(shù)據(jù)庫(kù)(如Gene投储、Protein等)以及外部數(shù)據(jù)庫(kù)(如ChEMBL第练、DrugBank等)有鏈接,方便進(jìn)行交叉查詢(xún)玛荞。
然而對(duì)于非專(zhuān)業(yè)人士來(lái)說(shuō)娇掏,目前還有一些問(wèn)題需要解決。PubChem的搜索選項(xiàng)可能過(guò)于復(fù)雜勋眯,需要一定的學(xué)習(xí)成本婴梧。PubChem的用戶(hù)界面不夠直觀或簡(jiǎn)潔。對(duì)于某些特定的化合物或研究領(lǐng)域客蹋,PubChem提供的數(shù)據(jù)可能不夠詳細(xì)或深入塞蹭。在查詢(xún)化合物參與的反應(yīng)數(shù)據(jù)時(shí),不能清晰明確的展示結(jié)果讶坯。
實(shí)際上番电,在使用過(guò)程中,我發(fā)現(xiàn)了款國(guó)產(chǎn)化學(xué)數(shù)據(jù)庫(kù)MolAid化合物檢索及智能合成一體化數(shù)字平臺(tái)辆琅,我覺(jué)得它可能更符合我們的需求漱办。
MolAid 不但擁有PubChem核心功能(關(guān)鍵詞檢索和結(jié)構(gòu)檢索),還支持譜圖檢索婉烟。同時(shí)還收錄了海量的化合物信息娩井,包括了化合物的物化性質(zhì)、ADMET似袁、反應(yīng)信息洞辣、晶體數(shù)據(jù)咐刨、譜圖信息、SDS等內(nèi)容扬霜。
MolAid平臺(tái)的數(shù)據(jù)情況如下:
化合物數(shù)據(jù):收錄了1.6億個(gè)化合物并且數(shù)量持續(xù)更新增長(zhǎng)
反應(yīng)數(shù)據(jù):擁有5000萬(wàn)條反應(yīng)數(shù)據(jù)所宰,搭建人機(jī)結(jié)合反應(yīng)提取工程,反應(yīng)量不斷增長(zhǎng)畜挥,為用戶(hù)提供高質(zhì)量反應(yīng)信息仔粥。
譜圖數(shù)據(jù):20萬(wàn)張真實(shí)實(shí)驗(yàn)譜圖(氫譜、碳譜蟹但、質(zhì)譜躯泰、拉曼、紅外)华糖。
晶體數(shù)據(jù):100萬(wàn)有機(jī)晶體數(shù)據(jù)麦向,可查看晶體晶胞參數(shù)以及參考文獻(xiàn)。
商品數(shù)據(jù)庫(kù):740萬(wàn)條商品信息客叉,涵蓋各大知名供應(yīng)商诵竭。
MolAid平臺(tái)中文操作界面,使用起來(lái)非常容易上手兼搏!