論文:http://www.aclweb.org/anthology/P16-1073
將句子改寫應(yīng)用在語(yǔ)義分析上。
問(wèn)題
語(yǔ)義分析存在的主要問(wèn)題是原始自然語(yǔ)言與目標(biāo)本體之間的錯(cuò)配問(wèn)題员串。`
模型
利用句子改寫蹂楣,將句子改寫成與目標(biāo)本體結(jié)構(gòu)一致的句子坯钦。
兩個(gè)改寫模型來(lái)解決兩類錯(cuò)配赋除。
(注:錯(cuò)配不是看單詞個(gè)數(shù)袋马,而是看是否有邏輯&)
基于字典的模型來(lái)解決1-N錯(cuò)配
1-N錯(cuò)配
daughter->child&feamale
基于字典的模型
利用單詞在字典里的解釋來(lái)對(duì)單詞進(jìn)行改寫漏健。字典會(huì)用單詞的多個(gè)含義以&的形式來(lái)解釋這個(gè)單詞嚎货。
只改寫普通名詞。
基于模板的模型來(lái)解決N-1錯(cuò)配
N-1錯(cuò)配
how many people&live in->population
基于模板的模型
模板其實(shí)也是規(guī)則蔫浆,是改寫pair對(duì)規(guī)則殖属。
用WikiAnswers paraphrase語(yǔ)料來(lái)構(gòu)建模板,并過(guò)濾掉相同詞個(gè)數(shù)<=3的克懊。
框架
一個(gè)句子忱辅,會(huì)有多個(gè)改寫結(jié)果,繼而會(huì)有多個(gè)目標(biāo)本體谭溉,然后在多個(gè)目標(biāo)本體中選擇最優(yōu)的目標(biāo)本體墙懂。
挑選最優(yōu)目標(biāo)本體模型
排名函數(shù)來(lái)綜合選擇最優(yōu)的改寫和正確結(jié)構(gòu)
語(yǔ)義分析模型會(huì)給出一個(gè)分值
其中參數(shù)可以這樣學(xué)到
總體評(píng)分函數(shù)
其中
表示句子改寫的得分
其中的參數(shù)用以下方式訓(xùn)練得到
表示語(yǔ)義分析的得分
其中的參數(shù)用以下方式訓(xùn)練得到
這兩個(gè)參數(shù)同時(shí)更新
看論文時(shí)的疑問(wèn)
句子改寫的訓(xùn)練數(shù)據(jù)如何準(zhǔn)備
基于字典與模板的模型都相當(dāng)于是規(guī)則,不用訓(xùn)練數(shù)據(jù)去訓(xùn)練模型
如何判斷是否與目標(biāo)主體結(jié)構(gòu)一致
直接是用總體評(píng)分函數(shù)來(lái)選擇最優(yōu)的目標(biāo)本體扮念,跳過(guò)了中間的判斷是否結(jié)構(gòu)一致的問(wèn)題损搬。