2020-03-30~04-05 論文筆記

Effective Search of Logical Forms for Weakly Supervised Knowledge-Based Question Answering

基于知識的問題解答(KBQA)的許多算法都依賴于語義分析鸟廓,這會將問題轉(zhuǎn)換為邏輯形式鳞疲。當僅提供弱監(jiān)督時,通常需要搜索有效的邏輯形式以進行模型訓練后专。但是,一個復雜的問題通常會涉及巨大的搜索空間侄刽,這會產(chǎn)生兩個主要問題:1)受計算時間和內(nèi)存限制的解決方案通常會降低搜索的成功率,以及2)搜索結(jié)果會降低訓練數(shù)據(jù)的質(zhì)量一汽。這兩個問題導致了語義訓練模型的訓練不足旷痕。在這項工作中碳锈,我們提出了一種基于對問題的算子預測的弱監(jiān)督KBQA的有效搜索方法。通過受預測的運算符約束的搜索空間欺抗,可以探索足夠的搜索路徑售碳,可以推導更有效的邏輯形式,并且可以避免可能引起虛假邏輯形式的運算符绞呈。結(jié)果贸人,在弱監(jiān)督訓練集中的大部分問題都配備了邏輯形式,而生成的可疑邏輯形式更少佃声。這樣高質(zhì)量的訓練數(shù)據(jù)直接有助于建立更好的語義解析模型艺智。在最大的KBQA數(shù)據(jù)集之一(即CSQA)上的實驗結(jié)果證明了我們方法的有效性:就總分而言,將精度從67%提高到72%圾亏,召回率從67%提高到72%力惯。


整體架構(gòu)

本文的做法就是,對于只有問題和答案的訓練集召嘶,通過搜索一個被縮小的邏輯形式空間,來找到一個合適的邏輯形式作為訓練數(shù)據(jù)哮缺,然后進行KBQA的訓練弄跌。
我們提出了一種新的方法,通過對弱監(jiān)督的KBQA任務的操作員預測來有效搜索邏輯形式尝苇,該方法為下游問題向邏輯形式的翻譯模型訓練提供了充足且優(yōu)越的數(shù)據(jù)铛只,并使訓練和推理在以下情況下更有效 可能的操作員的約束。 所提出的方法簡單有效糠溜,具有很大的實際應用價值淳玩。 實驗結(jié)果證明了我們方法在減少虛假邏輯形式,提高搜索成功率非竿,提高搜索效率以及提高最終答案準確性方面的有效性蜕着。

Weakly Supervised Multi-task Learning for Semantic Parsing

語義解析是一項具有挑戰(zhàn)性且重要的任務,旨在將自然語言的感知轉(zhuǎn)換為邏輯形式『熘現(xiàn)有的神經(jīng)語義解析方法主要使用<問題承匣,邏輯形式>(Q-L)對來訓練序列到序列模型。但是锤悄,現(xiàn)有Q-L標記數(shù)據(jù)的數(shù)量有限且難以獲得韧骗。我們提出了一種有效的方法,該方法充分利用了來自其他任務的標簽信息來增強語義解析器的訓練零聚。我們設計了一個多任務學習模型來訓練問題類型分類袍暴,實體提及檢測以及使用共享編碼器的問題語義解析些侍。我們提出了一種弱監(jiān)督學習方法,以基于短語的問題應該具有相同的邏輯形式和問題類型信息的思想來增強使用短語數(shù)據(jù)的多任務學習模型政模。最后岗宣,我們將弱監(jiān)督的多任務學習方法集成到編碼器-解碼器框架中。在新構(gòu)建的數(shù)據(jù)集和ComplexWebQuestions上進行的實驗表明览徒,我們提出的方法優(yōu)于最新方法狈定,這證明了我們方法的有效性和魯棒性。
主要的方法就是使用多任務學習來解決標簽不夠的問題习蓬。
在本文中纽什,我們提出了一種用于語義解析的弱監(jiān)督多任務學習方法。 我們設計了一個多任務架構(gòu)躲叼,該架構(gòu)將問題類型和提及標記信息合并到語義解析器中芦缰。 為了進一步提高模型的性能和一致性,我們提出了一種弱監(jiān)督的方法來增強我們的多任務學習模型枫慷。 在兩個數(shù)據(jù)集上的實驗表明让蕾,我們的多任務學習體系結(jié)構(gòu)顯著提高了基線方法的性能。 此外或听,我們提出的弱監(jiān)督學習機制有效地提高了多任務學習模型的性能探孝。

Weakly Supervised Semantic Parsing with Abstract Examples

從弱監(jiān)督(符號)而不是強監(jiān)督(程序)訓練語義解析器會使訓練變得很復雜,有兩種方式誉裆。首先顿颅,在訓練時需要探索大量的潛在節(jié)目,以找到正確的節(jié)目足丢。其次粱腻,偶然導致正確命名的虛假程序會給訓練增加噪音。在這項工作中斩跌,我們提出绍些,在具有清晰語義類型的封閉世界中,人們可以通過使用抽象表示來顯著緩解這些問題耀鸦,在抽象表示中柬批,語言表達和程序中的標記都被提升為抽象形式。我們證明了可以用一些詞匯規(guī)則來定義這些抽象袖订,并且它們導致了不同示例之間的共享萝快,從而減輕了訓練中的困難。為了測試我們的方法著角,我們開發(fā)了第一個用于CNLVR的語義解析器揪漩,這是一個具有挑戰(zhàn)性的視覺推理數(shù)據(jù)集,其中的搜索空間很大吏口,克服虛假性至關重要奄容,因為表示法為TRUE或FALSE冰更,因此是隨機程序可能會導致正確的表示方式。我們的方法大大提高了性能昂勒,達到了82.5%的準確度蜀细,與迄今為止報告的最佳準確性相比,絕對準確度提高了14.7%戈盈。


overview

在這項工作中奠衔,我們以結(jié)構(gòu)化表示作為輸入,提出了第一個CNLVR數(shù)據(jù)集的語義解析器塘娶。我們的主要見解是归斤,在封閉的,類型良好的域中刁岸,我們可以生成抽象的示例脏里,這些示例可以幫助解決從延遲的監(jiān)督訓練解析器的難題。首先虹曙,我們使用抽象示例半自動生成有助于熱啟動我們的參數(shù)的發(fā)聲程序?qū)ζ群幔瑥亩鴾p少了尋找具有隨機參數(shù)的正確程序的艱巨搜索挑戰(zhàn)。第二酝碳,我們專注于示例的抽象表示矾踱,它使我們能夠通過在不同示例之間共享有關有前途的程序的信息來解決虛假情況并減輕搜索。我們的方法極大地提高了CNLVR的性能疏哗,建立了新的技術(shù)水平介返。在本文中,我們使用了手動構(gòu)建的高精度詞典來構(gòu)建抽象示例沃斤。這適用于類型良好的域,這些域在虛擬助手用例中無處不在刃宵。在未來的工作中衡瓶,我們計劃擴展這項工作,并自動學習這樣的詞典牲证。這可以減少人工工作哮针,并擴展到語言方面存在很大差異的更大范圍。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末坦袍,一起剝皮案震驚了整個濱河市十厢,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌捂齐,老刑警劉巖蛮放,帶你破解...
    沈念sama閱讀 219,589評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異奠宜,居然都是意外死亡包颁,警方通過查閱死者的電腦和手機瞻想,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,615評論 3 396
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來娩嚼,“玉大人蘑险,你說我怎么就攤上這事≡牢颍” “怎么了佃迄?”我有些...
    開封第一講書人閱讀 165,933評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長贵少。 經(jīng)常有香客問我呵俏,道長,這世上最難降的妖魔是什么春瞬? 我笑而不...
    開封第一講書人閱讀 58,976評論 1 295
  • 正文 為了忘掉前任柴信,我火速辦了婚禮,結(jié)果婚禮上宽气,老公的妹妹穿的比我還像新娘随常。我一直安慰自己,他們只是感情好萄涯,可當我...
    茶點故事閱讀 67,999評論 6 393
  • 文/花漫 我一把揭開白布绪氛。 她就那樣靜靜地躺著,像睡著了一般涝影。 火紅的嫁衣襯著肌膚如雪枣察。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,775評論 1 307
  • 那天燃逻,我揣著相機與錄音序目,去河邊找鬼。 笑死伯襟,一個胖子當著我的面吹牛猿涨,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播姆怪,決...
    沈念sama閱讀 40,474評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼叛赚,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了稽揭?” 一聲冷哼從身側(cè)響起俺附,我...
    開封第一講書人閱讀 39,359評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎溪掀,沒想到半個月后事镣,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,854評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡揪胃,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,007評論 3 338
  • 正文 我和宋清朗相戀三年蛮浑,在試婚紗的時候發(fā)現(xiàn)自己被綠了唠叛。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,146評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡沮稚,死狀恐怖艺沼,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情蕴掏,我是刑警寧澤障般,帶...
    沈念sama閱讀 35,826評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站盛杰,受9級特大地震影響挽荡,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜即供,卻給世界環(huán)境...
    茶點故事閱讀 41,484評論 3 331
  • 文/蒙蒙 一定拟、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧逗嫡,春花似錦青自、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,029評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至抹锄,卻和暖如春逆瑞,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背伙单。 一陣腳步聲響...
    開封第一講書人閱讀 33,153評論 1 272
  • 我被黑心中介騙來泰國打工获高, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人吻育。 一個月前我還...
    沈念sama閱讀 48,420評論 3 373
  • 正文 我出身青樓念秧,卻偏偏與公主長得像,于是被迫代替她去往敵國和親扫沼。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,107評論 2 356

推薦閱讀更多精彩內(nèi)容

  • 前面的文章主要從理論的角度介紹了自然語言人機對話系統(tǒng)所可能涉及到的多個領域的經(jīng)典模型和基礎知識庄吼。這篇文章缎除,甚至之后...
    我偏笑_NSNirvana閱讀 13,917評論 2 64
  • 主要內(nèi)容 自然語言輸入編碼 前饋網(wǎng)絡 卷積網(wǎng)絡 循環(huán)網(wǎng)絡(recurrent networks ) 遞歸網(wǎng)絡(re...
    JackHorse閱讀 4,133評論 0 2
  • 原文地址 摘要 隨著網(wǎng)絡的不斷發(fā)展,百科網(wǎng)頁总寻、搜索網(wǎng)頁器罐、問答社區(qū)等也隨之發(fā)展,壯大渐行,在這些應用上轰坊,機器人的自動回答...
    YBDSup閱讀 4,534評論 0 2
  • Compositional Semantic Parsing on Semi-Structured Tables ...
    Dreamer_df74閱讀 646評論 0 0
  • 看山看水看禮盒(離合) 看路看風看新歷(心情) 寫作課題 人是永痕的嗎铸董,不是。人是永恒的嗎肴沫,是的
    知鈞閱讀 108評論 0 0