無(wú)參考摘要評(píng)價(jià)

兩個(gè)衡量標(biāo)準(zhǔn):語(yǔ)義相關(guān)性和壓縮比

語(yǔ)義分布相關(guān)性 Semantic Distribution Correlation (SDC):自回歸語(yǔ)言模型

有一個(gè)文檔 D = {x1, x2, ..., xn}宁脊,將聯(lián)合概率因式分解為條件概率的乘積,并以此表示D彼宠,式子如下

在自回歸語(yǔ)言模型中澜公,以此作為D的語(yǔ)義信息恶座,但這里我們用p(xt|x<t)來(lái)表示xt的語(yǔ)義并且使用一個(gè)向量P(D)來(lái)表示由語(yǔ)言模型生成的D的語(yǔ)義分布核蘸,如式(2)所示:

? ? ? ? ? ? ? ? ? ? ? ? ? ? ?P(D) = [p(x1), p(x2|x<2), ..., p(xn|x<n)]

摘要S由令牌y組成,使用語(yǔ)言模型以S為提示來(lái)預(yù)測(cè)D呻右。摘要越好哑子,文章的還原效果越好舅列。我們根據(jù)S計(jì)算D的語(yǔ)義分布:

? ? ? ? ? ? ? ? ??P(D|S) = [p(x1|S), p(x2|x<2, S), ...,p(xn|x<n, S)]

自回歸語(yǔ)言模型語(yǔ)義分布框架

將P(D)與P(D|S)之間的相關(guān)性作為對(duì)摘要S的評(píng)估分?jǐn)?shù):

其中Corr用的是皮爾遜相關(guān)系數(shù)奉芦,這個(gè)系數(shù)是用于度量?jī)蓚€(gè)變量X和Y之間的相關(guān)性(線(xiàn)性相關(guān)),其值介于-1與1之間剧蹂。W(D, S)表示通過(guò)給定摘要S能預(yù)測(cè)出源文本D的程度声功。生成的摘要越好,W(D, S)分?jǐn)?shù)越高宠叼,注意先巴,其中Cnorm ∈ [0, 1),在計(jì)算的過(guò)程中需要進(jìn)行歸一化處理冒冬。因此伸蚯,SDC的值越大,生成摘要的質(zhì)量越好简烤。

帶壓縮比的SDC

壓縮比反映了生成摘要的難度剂邮,計(jì)算公式為CR(D, S) = L(S) / L(D),其中横侦,L表示文本的長(zhǎng)度挥萌,即壓縮比等于摘要的長(zhǎng)度除以源文本的長(zhǎng)度。如果L(S)大于L(D)枉侧,CR(D, S)的值為1引瀑。顯然,生成的摘要越短難度越高榨馁,下面我們將壓縮比引入SDC的計(jì)算:

上面的式子使得有較高語(yǔ)義分布相關(guān)性和較低壓縮比的摘要在模型中獲得較高的分?jǐn)?shù)憨栽。

實(shí)驗(yàn)方法

1、數(shù)據(jù)集:由源文本翼虫、基于不同模型生成的摘要和人工注釋的分?jǐn)?shù)組成的兩個(gè)數(shù)據(jù)集屑柔,分別為CNN/Daily Mail (CNNDM)、TAC 2010 (TAC)

2珍剑、基線(xiàn):4個(gè)基于參考的評(píng)價(jià)指標(biāo)掸宛,ROUGE-1 (R-1),ROUGE-2 (R-2) 和 ROUGE-L (R-L)的F1分?jǐn)?shù)、BLEU次慢、METEOR (MET.)旁涤、BERTScore(BERT.)翔曲,2個(gè)無(wú)參考的評(píng)價(jià)指標(biāo)迫像,BLANC (BLA.)、Shannon (Shan.)瞳遍。

參考文獻(xiàn):Reference-free Summarization Evaluation via Semantic Correlation and Compression Ratio

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末闻妓,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子掠械,更是在濱河造成了極大的恐慌由缆,老刑警劉巖注祖,帶你破解...
    沈念sama閱讀 219,366評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異均唉,居然都是意外死亡是晨,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)舔箭,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)罩缴,“玉大人,你說(shuō)我怎么就攤上這事层扶◇镎拢” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,689評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵镜会,是天一觀的道長(zhǎng)檬寂。 經(jīng)常有香客問(wèn)我,道長(zhǎng)戳表,這世上最難降的妖魔是什么桶至? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,925評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮匾旭,結(jié)果婚禮上塞茅,老公的妹妹穿的比我還像新娘。我一直安慰自己季率,他們只是感情好野瘦,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,942評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著飒泻,像睡著了一般鞭光。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上泞遗,一...
    開(kāi)封第一講書(shū)人閱讀 51,727評(píng)論 1 305
  • 那天惰许,我揣著相機(jī)與錄音,去河邊找鬼史辙。 笑死汹买,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的聊倔。 我是一名探鬼主播晦毙,決...
    沈念sama閱讀 40,447評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼耙蔑!你這毒婦竟也來(lái)了见妒?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,349評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤甸陌,失蹤者是張志新(化名)和其女友劉穎须揣,沒(méi)想到半個(gè)月后盐股,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,820評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡耻卡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,990評(píng)論 3 337
  • 正文 我和宋清朗相戀三年疯汁,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片卵酪。...
    茶點(diǎn)故事閱讀 40,127評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡涛目,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出凛澎,到底是詐尸還是另有隱情霹肝,我是刑警寧澤,帶...
    沈念sama閱讀 35,812評(píng)論 5 346
  • 正文 年R本政府宣布塑煎,位于F島的核電站沫换,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏最铁。R本人自食惡果不足惜讯赏,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,471評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望冷尉。 院中可真熱鬧漱挎,春花似錦、人聲如沸雀哨。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,017評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)雾棺。三九已至膊夹,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間捌浩,已是汗流浹背放刨。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,142評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留尸饺,地道東北人进统。 一個(gè)月前我還...
    沈念sama閱讀 48,388評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像浪听,于是被迫代替她去往敵國(guó)和親螟碎。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,066評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容