Modelling Ontology Evaluation and Validation
摘要:我們提出了一種全面的本體評(píng)估和驗(yàn)證方法断序,這已成為語(yǔ)義技術(shù)發(fā)展的關(guān)鍵問(wèn)題『烤現(xiàn)有的評(píng)估方法通過(guò)正式模型集成到一個(gè)sigle框架中。該模型首先包括一個(gè)名為O2的元生物學(xué),它將本體描述為符號(hào)學(xué)對(duì)象。基于O2和現(xiàn)有方法的分析小槐,我們確定了三種主要的評(píng)估方法:結(jié)構(gòu)測(cè)量,這是典型的本體表示為圖形;功能性措施荷辕,與本體及其組件的預(yù)期用途相關(guān);和可用性分析測(cè)量凿跳,取決于所考慮的本體的注釋級(jí)別。然后疮方,使用稱為oQual的本體驗(yàn)證本體論來(lái)補(bǔ)充元素學(xué)控嗜,其提供了在給定項(xiàng)目的上下文中設(shè)計(jì)用于選擇本體的最佳標(biāo)準(zhǔn)的方法。最后骡显,我們提供了一個(gè)如何將oQual派生標(biāo)準(zhǔn)應(yīng)用于驗(yàn)證案例的小例子疆栏。
1. Introduction
1994年(見(jiàn)[21])出現(xiàn)了對(duì)本體開(kāi)發(fā)和再利用領(lǐng)域評(píng)估方法的需求,并且從那時(shí)起它一直在穩(wěn)步增長(zhǎng)惫谤。然而壁顶,迄今為止尚未提出針對(duì)該問(wèn)題的全面和全球方法。這種情況可能成為語(yǔ)義技術(shù)成功的嚴(yán)重障礙溜歪,特別是在工業(yè)和商業(yè)領(lǐng)域若专。這種意義上的典型示例是語(yǔ)義Web的開(kāi)發(fā)。一方面蝴猪,通過(guò)本體傳達(dá)語(yǔ)義的想法無(wú)疑引起了ICT行業(yè)大部分的興趣调衰。本體承諾是網(wǎng)絡(luò)技術(shù)的關(guān)鍵組成部分,能夠應(yīng)對(duì)高度互連自阱,不斷變化和不完整嚎莉。然而,另一方面沛豌,缺乏對(duì)本體評(píng)估和驗(yàn)證的充分理解和共享的概念顯著減慢了本體從深?yuàn)W的符號(hào)結(jié)構(gòu)向可靠的工業(yè)組件的轉(zhuǎn)變趋箩。在本文中,我們從它們集成到一個(gè)單一框架的角度來(lái)看現(xiàn)有的本體評(píng)估方法加派。為此阁簸,我們建立了一個(gè)正式的本體評(píng)估模型,首先包括一個(gè)元本體 - 稱為O2--它將本體描述為符號(hào)學(xué)對(duì)象哼丈。 O2旨在為評(píng)估所針對(duì)的元素和特征提供基礎(chǔ)。其次筛严,基于O2和現(xiàn)有技術(shù)的概述(參見(jiàn)[8])醉旦,我們提供了用于評(píng)估本體的定性和定量測(cè)量的臨時(shí)目錄。我們確定了三種主要類型的措施:結(jié)構(gòu)性措施,這是典型的表示為圖形的本體;功能測(cè)量车胡,與本體及其組件的預(yù)期用途有關(guān)檬输,即它們的功能;可用性分析測(cè)量,取決于所考慮的本體的注釋級(jí)別匈棘。第三丧慈,元本體論補(bǔ)充了本體驗(yàn)證的本體論 - oQual - 它允許通過(guò)O2獲取本體元素,提供質(zhì)量參數(shù)主卫,并在可行時(shí)提供其排序功能逃默。 O2和oQual在FOL中部分正式化,目前作為OWL模型進(jìn)行維護(hù)簇搅,插入DOLCE本體庫(kù)及其設(shè)計(jì)模式[25]完域。在實(shí)踐中,我們將本體評(píng)估建模為基于本體描述的診斷任務(wù)瘩将。這樣的描述明確了一些對(duì)本體驗(yàn)證至關(guān)重要的知識(shí)項(xiàng)吟税,例如:所考慮的本體的元素的角色和功能;描述的參數(shù)通常表示本體的質(zhì)量;以及根據(jù)優(yōu)先順序組成這些參數(shù)的函數(shù)。在本文的最后姿现,我們描繪了在組成具有沖突參數(shù)的原則時(shí)所需的權(quán)衡的分析示例肠仪,即將oQual派生標(biāo)準(zhǔn)應(yīng)用于驗(yàn)證案例。最后备典,得出了一些結(jié)論异旧。
2. O2: a semiotic meta-ontolog
元本體的使用在語(yǔ)義網(wǎng)中變得相關(guān),因?yàn)樗鼈円子诩刹⑶揖哂斜倔w的共享構(gòu)造方法熊经。
例如泽艘,最近提出了一種本體元數(shù)據(jù)詞匯表。遵循這種趨勢(shì)镐依,我們將本體描述為符號(hào)學(xué)對(duì)象匹涮,即由信息對(duì)象構(gòu)成的對(duì)象和在通信設(shè)置內(nèi)建立的預(yù)期概念化。我們提議的這一部分背后的基本直覺(jué)是槐壳,信息可以由用于表示另一種模式的任何模式構(gòu)成然低,而該表示可以被某些理性代理解釋為解釋,指令务唐,命令等雳攘。這是一個(gè)這個(gè)想法至少可以追溯到Peirce(參見(jiàn)[17])。這種直覺(jué)通過(guò)應(yīng)用稱為信息?描述(參見(jiàn)[7])的本體設(shè)計(jì)模式來(lái)形式化枫笛,并且發(fā)起了一種稱為O2的新模式(因?yàn)樗恰霸倔w”)吨灭。反過(guò)來(lái),O2正式化了以下規(guī)范:a)本體是一種特殊的信息; b)其圖案是圖形結(jié)構(gòu); c)它們代表預(yù)期的概念化刑巧,即實(shí)體類型的內(nèi)部表示(由理性代理)喧兄。例如无畔,完全可以為地鐵定義一個(gè)本體,但很難將倫敦地鐵的圖形視為本體 - 最多吠冤,后者可以被視為適當(dāng)?shù)牡罔F本體模型浑彰。在O2(圖1)中,本體圖具有預(yù)期的概念化和概念化所承認(rèn)的形式語(yǔ)義空間拯辙。圖形和概念化由編碼/解釋圖形的理性代理“保持在一起”郭变,同時(shí)在內(nèi)部表示其預(yù)期的概念化。代理還可以提供包含表示本體的“描述”的元數(shù)據(jù)的簡(jiǎn)檔涯保,例如诉濒,一種測(cè)量本體圖的結(jié)構(gòu)或功能屬性,其結(jié)果屬性遭赂,可能的質(zhì)量標(biāo)準(zhǔn)和值以及生命周期注釋(如出處和非正式注釋)的方法循诉。良好的配置文件通常會(huì)增強(qiáng)或強(qiáng)化本體的可用性。
3. Measures for ontology evaluation
關(guān)于本體評(píng)估的文獻(xiàn)是零碎的撇他。大多數(shù)方法可以解決或多或少的具體評(píng)估問(wèn)題茄猫,但通常不系統(tǒng)地進(jìn)行。只有[11]試圖通過(guò)為本體評(píng)估方法提供分類網(wǎng)格來(lái)解決問(wèn)題困肩。這樣的網(wǎng)格允許根據(jù)以下問(wèn)題的答案來(lái)呈現(xiàn)方法:所考慮的方法/工具(結(jié)構(gòu))是什么划纽?次要的:它的目標(biāo)是什么(目標(biāo))?它支持哪些功能(功能)锌畸?可以應(yīng)用本體論的哪個(gè)階段(應(yīng)用程序)勇劣?此外,該方法有用嗎潭枣?次要地:它構(gòu)思了哪種類型的用戶(用戶類型:知識(shí)工程師比默,項(xiàng)目經(jīng)理,應(yīng)用用戶盆犁,本體開(kāi)發(fā)人員)命咐?它的實(shí)踐意義(實(shí)用性)如何?它有多可用(可用性)谐岁?它首先構(gòu)思了哪些用途(用例)醋奠?部分基于這樣的網(wǎng)格,并分析相關(guān)的最相關(guān)的文獻(xiàn)(特別是[24]伊佃,[14]窜司,[23],[19]航揉,[18]塞祈,[9],[6]和[16] ])帅涂,我們?yōu)楸倔w設(shè)計(jì)了大量可能的測(cè)量方法织咧,并以O(shè)2提供的模式對(duì)它們進(jìn)行框架化胀葱。我們?cè)诖私榻B度量集之間的主要區(qū)別,并為其中一些提供一些示例笙蒙。 有關(guān)已確定的措施的完整列表和詳細(xì)的最新審查,請(qǐng)參見(jiàn)[8]庆锦。
3.1 Measure types
如上所述捅位,通過(guò)本體,我們指的是符號(hào)對(duì)象搂抒,包括圖形對(duì)象艇搀,形式語(yǔ)義空間,概念化和注釋簡(jiǎn)檔;因此求晶,我們建議相對(duì)于三個(gè)主要維度來(lái)衡量本體:結(jié)構(gòu)焰雕,功能和可用性分析。本體的結(jié)構(gòu)維度側(cè)重于語(yǔ)法和形式語(yǔ)義芳杏,即表示為圖形的本體矩屁。在這種形式中,本體的拓?fù)渚粽裕壿嫼徒饘賹傩钥梢酝ㄟ^(guò)無(wú)上下文度量來(lái)度量吝秕。功能維度與給定本體及其組件的預(yù)期用途有關(guān),即它們?cè)谏舷挛闹械墓δ芸栈谩V攸c(diǎn)是本體所指定的概念化烁峭。最后,可用性概要維度側(cè)重于本體概要(注釋)秕铛,其通常解決本體的通信上下文(即其語(yǔ)用學(xué))约郁。請(qǐng)注意,這些維度遵循邏輯類型的分區(qū):在結(jié)構(gòu)上但两,我們將本體視為(信息)對(duì)象;在功能上鬓梅,我們將其視為一種語(yǔ)言(信息對(duì)象+預(yù)期的概念化),從可用性的角度來(lái)看镜遣,我們看一下它的元語(yǔ)言(關(guān)于本體的符號(hào)語(yǔ)境的概況)己肮。因此,尺寸類型對(duì)應(yīng)于O2圖案的成分悲关,并且需要不同的測(cè)量方法谎僻。
3.2 Measuring the structural dimension