三種處理歧義性對象的學(xué)習(xí)框架:
-
多示例學(xué)習(xí)
從 輸入空間髓需,即內(nèi)容表示上考察對象的歧義性辱挥。 -
多標記學(xué)
從輸出空間,即概念標記上來考察對象的歧義性按声。 -
多示例多標記學(xué)習(xí)
從輸入和輸出兩個空間同時考察對象的歧義性修械。
多標記學(xué)習(xí)
- 訓(xùn)練集中的每個示例均對應(yīng)于一組概念標記把鉴,學(xué)習(xí)系統(tǒng)通過對多標記示例構(gòu)成的訓(xùn)練集進行學(xué)習(xí)仆潮,以盡可能地正確預(yù)測訓(xùn)練集之外的示例的概念集合宏蛉。
- 傳統(tǒng)的二類以及多類分類學(xué)習(xí)問題可看作多標記學(xué)習(xí)問題的特例。一種直觀的解決多標記學(xué)習(xí)問題的方法是將其分解為多個獨立的二類分類問題求解性置,其中每個二類分類問題對應(yīng)于一個可能的概念類拾并。但該方法沒有考慮到每個樣本所對應(yīng)概念標記之間的相關(guān)性,因而泛華性能不理想鹏浅。
- 多標記學(xué)習(xí)問題的主要難點在于如何充分利用各訓(xùn)練樣本所含多個概念標記之間的相關(guān)性嗅义,從而有效地預(yù)測未知樣本的概念標記集合。
多標記學(xué)習(xí)問題求解的3類策略
1. “一階”策略
通過逐一考察單個標記而忽略標記之間的相關(guān)性隐砸,如將多標記學(xué)習(xí)問題分解為q個獨立的二類分類問題之碗,從而構(gòu)成多標記學(xué)習(xí)系統(tǒng)。
優(yōu)點:效率高且實現(xiàn)簡單
缺點:忽略了標機之間可能存在的相關(guān)性季希,系統(tǒng)的泛華性能較低褪那。
2. “二階”策略
該策略通過考察兩兩標記之間的相關(guān)性幽纷,如相關(guān)標記與無關(guān)標記之間的排序關(guān)系, 兩兩標記之間的交互關(guān)系等博敬,從而構(gòu)成多標記學(xué)習(xí)系統(tǒng)友浸。
優(yōu)點:在一定程度上考察了標機之間的相關(guān)性,因而泛化性能較優(yōu)偏窝。
缺點:當(dāng)真是世界問題中標記之間具有超越二階的相關(guān)性時收恢,該類方法的性能將會受到很大的影響。
3. “高階”策略
通過考察高階的標記相關(guān)性囚枪,如處理任一標記對其它所有標記的影響派诬,處理一組隨機標記集合的相關(guān)性等等劳淆,從而構(gòu)成多標記學(xué)習(xí)系統(tǒng)链沼。
優(yōu)點:可以較好地反應(yīng)真實世界問題的標記相關(guān)性
缺點:模型復(fù)雜度過高,難以處理大規(guī)模學(xué)習(xí)問題沛鸵。