GNN和bert做Hot-potQA

hot-pot QA

  • reasoning提供sentence-levelsupporting fact
  • 數(shù)據(jù)集長這種形式芯肤,需要supporting facts的原因是需要對推理作出解釋,所以不僅要找到正確答案還要把supporting facts找出來媳禁。

Cognitive Graph for Multi-Hop Reading Comprehension at Scale

  • 問題的意思是誰導演了2003年的一個電影,這個電影有一個場景在洛杉磯的Quality Cafe拍攝的屡江,然后有5個段落巢钓,兩個段落是介紹Quality Cafe的,一個是介紹Log Angeles的睬辐,然后是兩個段落分別介紹兩部電影的挠阁。實心的線是理想的推理路線,圓形的是答案和候選答案溯饵。
  • 兩個系統(tǒng)侵俗,系統(tǒng)1負責提取和問題有關的entities以及answer candidates,系統(tǒng)2負責進行推理得到正確的答案丰刊。
  • Cognitive Graph 是一個有向圖隘谣,每一個圖中的節(jié)點要么是entity 要么是候選答案.
  • 系統(tǒng)1從關于實體x的介紹段落中得到answer candidates以及next-hop entities,注意這兩個不同種類的節(jié)點是用不同的方式提取的啄巧。
  • clue是一個concept寻歧,frontier nodes是新加入圖中的節(jié)點和與新加入節(jié)點有連接邊的節(jié)點。
  • 從圖中我們可以看到x是一個frontier nodes秩仆,然后將questioncluesx以及關于x的段落paragraph[x]得到第一是句子的表示sem[x,q,clues]以及x的下一個節(jié)點hop span以及ans span熄求,然后GNN是根據(jù)和x之前節(jié)點的表示過一個矩陣然后將所有的差值相加,然后在個x句子的表示共同得到的x的表示逗概。
  • 可以看到GNN更新的時候這次只更新了x并不是更新了完整的圖,而且沒有用到x的表示忘衍,而且sem[x,q,clues]不是最后一層的表示的而是倒數(shù)第三層的表示逾苫。
  • 還有不懂的是怎么得到的clues以及successor Node y
  • clues是提取節(jié)點x的那個句子。
  • 對于answer candidate來說沒有para[x]那么直接用sem[x,q,clues]來初始化節(jié)點的表示枚钓。如果連clues[x]也沒有那么就用question來初始化
  • 提取span铅搓,因為answer candidatenext hop兩種節(jié)點有不同的模式,比如如果問題是where開頭的搀捷,那么answer candidate更有可能是紐約而不是2019星掰,而下一個跳的entity的模式不是這樣的∧壑郏可以看到提取span的方法也很暴力氢烘,就是有四個指針指示從哪里開始哪里結(jié)束芝薇,那么問題來了,豈不是一個節(jié)點只能有一個answer candidate和一個next hop node饭于,SansEans等等都是可學習的參數(shù)蜀踏,有一個細節(jié)是選擇Kspans并且如果誰的概率低于cls位置的概率那么就被丟棄维蒙,這個位置的概率被稱為negative threshold
  • 說是因為最后一個層的cls hidden state用于進行span prediction就是上面的threshold所以這次是用,倒數(shù)第三層的當做句子的表示果覆。
  • 作者發(fā)現(xiàn)光更新frontier node和一次性更新全部節(jié)點是沒有什么區(qū)別的颅痊。
  • 得到答案是取出圖中的節(jié)點然后過全連接層得到表示。
  • 訓練集中的下一條和答案spans以及被提前取出來局待,因為答案只有一個斑响,所以答案的開始為1,而一個句子中可以有k個跳所以初始化為1/k表示每個跳躍的概率是一樣的燎猛,但是這個模型只能建模一個paragraph中只有一個跳的情況恋捆,那么就需要能夠很好的預測第一個跳的位置。
  • 每個答案有兩個negativerandomhop node中提取出來出來的span
  • 構(gòu)建圖的方法重绷,x是節(jié)點可以指向para,para中的supporting fact中有片段和gold entity 以及 answer 大致可以匹配到那么就將邊x,y連接起來沸停,這個就是連接初始邊的方法,后面的方法都是可以推斷得到的昭卓。實際上是直接把clues當成supporting fact愤钾。
  • 評估的時候不僅要把答案找到還要找到supporting facts,可解釋性就很強候醒。
  • 還有一個表示邏輯推斷嚴格性的一個指標能颁。
  • GNN真的很重要,直接提高了50%倒淫。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末伙菊,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子敌土,更是在濱河造成了極大的恐慌镜硕,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件返干,死亡現(xiàn)場離奇詭異兴枯,居然都是意外死亡,警方通過查閱死者的電腦和手機矩欠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進店門财剖,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人癌淮,你說我怎么就攤上這事躺坟。” “怎么了乳蓄?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長匣摘。 經(jīng)常有香客問我,道長庞瘸,這世上最難降的妖魔是什么赠叼? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任嘴办,我火速辦了婚禮,結(jié)果婚禮上贯被,老公的妹妹穿的比我還像新娘妆艘。我一直安慰自己,他們只是感情好幌陕,可當我...
    茶點故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布搏熄。 她就那樣靜靜地躺著暇赤,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上摆寄,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天,我揣著相機與錄音逗扒,去河邊找鬼欠橘。 笑死,一個胖子當著我的面吹牛黍檩,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播刽酱,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼棵里,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了典蝌?” 一聲冷哼從身側(cè)響起头谜,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤乔夯,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后侧纯,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體甲脏,經(jīng)...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡块请,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年墩新,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片绵疲。...
    茶點故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡臣疑,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出郁岩,到底是詐尸還是另有隱情,我是刑警寧澤萍摊,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布记餐,位于F島的核電站薇正,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏雕沿。R本人自食惡果不足惜猴仑,卻給世界環(huán)境...
    茶點故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望疾渣。 院中可真熱鬧崖飘,春花似錦、人聲如沸吊圾。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至廷支,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背啃憎。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留羡藐,地道東北人悯许。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓先壕,卻偏偏與公主長得像,于是被迫代替她去往敵國和親垃僚。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,976評論 2 355