**武當(dāng)派學(xué)渣**
什么是本體論
本體論(Ontology)是個哲學(xué)的概念耘沼,作為一門學(xué)問起源于對萬物本源的追問帜讲,最早這個詞在17世紀(jì)誕生溺森,從哲學(xué)意義上,本體論關(guān)注的是“存在”淘邻,即世界在本質(zhì)上有什么樣的東西存在茵典,或者世界存在哪些類別的實(shí)體。
本體論與信息科學(xué)
在人工智能領(lǐng)域宾舅,經(jīng)歷了60年代通用問題求解方法研究的困境统阿,學(xué)者們開始研究通過專門領(lǐng)域的知識表達(dá)來支持自動推理枚尼,以Dendral為代表的知識庫系統(tǒng)的成功確立了知識在解決人工智能問題方面的重要地位。為了減少構(gòu)建知識庫的代價砂吞,避免每次從頭開始署恍,有必要考慮知識的復(fù)用問題,通過復(fù)用蜻直,系統(tǒng)開發(fā)者可以在已有知識基礎(chǔ)上更加專注于特定領(lǐng)域的知識構(gòu)建盯质,且新系統(tǒng)可以利用復(fù)用知識與現(xiàn)存其他系統(tǒng)進(jìn)行交互。這樣概而,描述性的知識呼巷、問題解決方法及推理服務(wù)都可以在系統(tǒng)中實(shí)現(xiàn)共享,從而可以方便的構(gòu)建更大赎瑰,更好的知識庫王悍。還為了解決數(shù)據(jù)庫集成中專門化和不一致特征導(dǎo)致的實(shí)際問題。解決這些問題都需要對某個領(lǐng)域進(jìn)行通用概念上的描述餐曼,就必須回答這樣的問題:對于某個領(lǐng)域压储,本質(zhì)上有些什么樣的對象、過程源譬、屬性和關(guān)系集惋?什么是一項(xiàng)事務(wù)、一個人及一個組織踩娘?它們之間的相互依賴關(guān)系如何刮刑?這就是本體論研究的內(nèi)容。
AI邏輯學(xué)家在1980年提出:以邏輯概念為基礎(chǔ)的智能系統(tǒng)必須列出所有存在的事物养渴,并構(gòu)建一個本體描述我們的世界雷绢。
1993年,斯坦福大學(xué)知識系統(tǒng)實(shí)驗(yàn)室的Gruber給出了第一個在信息科學(xué)領(lǐng)域廣泛接受的Ontology定義: an ontology is an explicit specification of a conceptualization. 概念化是從特定目的的出發(fā)對所表達(dá)的世界所進(jìn)行的一種抽象的理卑、簡化的觀察翘紊。本體論是對某一概念化所做的一種顯式的解釋說明。本體論是一個邏輯理論傻工,用來說明一個正規(guī)(formal)詞匯表的預(yù)定含義霞溪。因此本體是語言相關(guān)的,而概念化則是語言無關(guān)的中捆,認(rèn)清這一點(diǎn)對本體集成、融合和轉(zhuǎn)換都非常重要坊饶。另外在上述定義中泄伪,概念化是比本體論(僅限于信息科學(xué)中)更為廣泛的概念,前者更接近領(lǐng)域的事實(shí)和哲學(xué)上的本體論匿级。
由于Web技術(shù)為全球信息共享提供了便捷手段蟋滴,以共享為特征的本體論與Web技術(shù)結(jié)合是必然趨勢染厅。在此背景下,基于Web標(biāo)準(zhǔn)的本體描述語言成為本體論研究和運(yùn)用的熱點(diǎn)津函。在標(biāo)準(zhǔn)方面肖粮,由W3C主持制訂的RDF和RDF Schema是建立在XML語法上,以語義網(wǎng)為理論基礎(chǔ)尔苦,對信息資源進(jìn)行語義描述的的語言規(guī)范涩馆,RDF采用資源(Resource)、屬性(Properties)允坚、和聲明(Statement)等三元組來描述事物魂那。RDF schema則做了進(jìn)一步擴(kuò)展。因此稠项,RDF成為一個能對本體進(jìn)行初步描述的標(biāo)準(zhǔn)語言涯雅。
本體論與語義Web
本體論在 WEP上的應(yīng)用導(dǎo)致了語義 WEP的誕生,其目的是解決Web上信息共享時的語義問題展运,語義WEP被看做是當(dāng)前本體論從學(xué)術(shù)研究走向?qū)嶋H應(yīng)用的最重要的構(gòu)想和研究計(jì)劃.
從技術(shù)上講活逆,語義Web要提供足夠而又合適的語義描述機(jī)制,然而拗胜,從整個應(yīng)用構(gòu)想來看划乖,語義Web要實(shí)現(xiàn)的是信息在知識級的共享和語義上的互操作性,這需要不同系統(tǒng)間有一個語義上的“共同理解”才行挤土。于是琴庵,本體論自然地成為指導(dǎo)語義Web發(fā)展的理論基礎(chǔ)。
本體論與生物醫(yī)學(xué)
復(fù)雜的生物學(xué)知識常常是以一種相互關(guān)聯(lián)且有層級(hierarchical)的方式存在仰美,需要有某種途徑和分子數(shù)據(jù)(例如測序產(chǎn)生的數(shù)據(jù))進(jìn)行整合迷殿,需要的領(lǐng)域很多,比如怎樣在解剖咖杂,信號傳導(dǎo)途徑庆寺,和表型之間的知識和數(shù)據(jù)建立聯(lián)系∷咦郑“生物本體論”(Bio-ontologies)的方法是解決這個問題的一種方式懦尝。用本體論的方法來規(guī)范特定生物領(lǐng)域的知識,用基于特定規(guī)則的概念來來界定和描述概念之間的關(guān)系壤圃,基于本體論“結(jié)構(gòu)化”后的知識就能和分子數(shù)據(jù)建立聯(lián)系陵霉。以“肱”這個概念為例,來解釋本體論就是伍绳,需要一系列“聲明”(assertions)來定義“肱”的內(nèi)涵和外延踊挠,比如它是手臂的一部分,含成骨細(xì)胞冲杀,有肌肉的粘附點(diǎn)效床,可以是骨頭等睹酌。在生物本體論的定義里,它不僅僅被定義成一系列關(guān)系的集合剩檀,它也有一個唯一的識別代碼(比如GO:0019505)憋沿。
以生物本體論領(lǐng)域應(yīng)用最廣的GO(基因本體論,Gene Ontology)為例沪猴,目前它已經(jīng)積累了16500個概念辐啄,GO連接了12000個基因來自20種模式生物,包含動物字币,植物则披,真菌,細(xì)菌和病毒洗出,每個基因已經(jīng)用唯一的GOID標(biāo)記士复。就每一個基因而言,會對其功能(function)翩活、參與的生物過程(biological process)和細(xì)胞定位(celluar?localization)進(jìn)行注釋阱洪。
OBI(生物醫(yī)學(xué)研究本體Ontology for biomedical investigations)是本體論在生物醫(yī)學(xué)研究的又一個例子。這是一個生物醫(yī)學(xué)領(lǐng)域本體論學(xué)者自發(fā)形成的組織菠镇,其宗旨是構(gòu)建和描述生命科學(xué)和臨床研究相關(guān)的本體( An integrated ontology for the description of life-science and clinical investigations)冗荸。它涉及用本體論的方法對研究設(shè)計(jì)、方案利耍、設(shè)備蚌本、研究數(shù)據(jù)、數(shù)據(jù)分析方法等進(jìn)行注釋隘梨。它源于功能基因組研究本體組織(FuGO), 它們之間涉及的共同Term是共享且一致的程癌。