hot-pot QA
- 為
reasoning
提供sentence-level
的supporting fact
- 數(shù)據(jù)集長這種形式芯肤,需要
supporting facts
的原因是需要對推理作出解釋,所以不僅要找到正確答案還要把supporting facts
找出來媳禁。
Cognitive Graph for Multi-Hop Reading Comprehension at Scale
- 問題的意思是誰導演了
2003
年的一個電影,這個電影有一個場景在洛杉磯的Quality Cafe
拍攝的屡江,然后有5
個段落巢钓,兩個段落是介紹Quality Cafe
的,一個是介紹Log Angeles
的睬辐,然后是兩個段落分別介紹兩部電影的挠阁。實心的線是理想的推理路線,圓形的是答案和候選答案溯饵。
- 兩個系統(tǒng)侵俗,系統(tǒng)
1
負責提取和問題有關的entities
以及answer candidates
,系統(tǒng)2
負責進行推理得到正確的答案丰刊。 -
Cognitive Graph
是一個有向圖隘谣,每一個圖中的節(jié)點要么是entity
要么是候選答案. - 系統(tǒng)
1
從關于實體x
的介紹段落中得到answer candidates
以及next-hop entities
,注意這兩個不同種類的節(jié)點是用不同的方式提取的啄巧。
-
clue
是一個concept
寻歧,frontier nodes
是新加入圖中的節(jié)點和與新加入節(jié)點有連接邊的節(jié)點。
- 從圖中我們可以看到
x
是一個frontier nodes
秩仆,然后將question
和cluesx
以及關于x
的段落paragraph[x]
得到第一是句子的表示sem[x,q,clues]
以及x
的下一個節(jié)點hop span
以及ans span
熄求,然后GNN
是根據(jù)和x
之前節(jié)點的表示過一個矩陣然后將所有的差值相加,然后在個x
句子的表示共同得到的x
的表示逗概。 - 可以看到
GNN
更新的時候這次只更新了x
并不是更新了完整的圖,而且沒有用到x
的表示忘衍,而且sem[x,q,clues]
不是最后一層的表示的而是倒數(shù)第三層的表示逾苫。
- 還有不懂的是怎么得到的
clues
以及successor Node y
-
clues
是提取節(jié)點x
的那個句子。 - 對于
answer candidate
來說沒有para[x]
那么直接用sem[x,q,clues]
來初始化節(jié)點的表示枚钓。如果連clues[x]
也沒有那么就用question
來初始化 - 提取
span
铅搓,因為answer candidate
和next hop
兩種節(jié)點有不同的模式,比如如果問題是where
開頭的搀捷,那么answer candidate
更有可能是紐約而不是2019
星掰,而下一個跳的entity
的模式不是這樣的∧壑郏可以看到提取span
的方法也很暴力氢烘,就是有四個指針指示從哪里開始哪里結(jié)束芝薇,那么問題來了,豈不是一個節(jié)點只能有一個answer candidate
和一個next hop node
饭于,Sans
和Eans
等等都是可學習的參數(shù)蜀踏,有一個細節(jié)是選擇K
個spans
并且如果誰的概率低于cls
位置的概率那么就被丟棄维蒙,這個位置的概率被稱為negative threshold
- 說是因為最后一個層的
cls hidden state
用于進行span prediction
就是上面的threshold
所以這次是用,倒數(shù)第三層的當做句子的表示果覆。 - 作者發(fā)現(xiàn)光更新
frontier node
和一次性更新全部節(jié)點是沒有什么區(qū)別的颅痊。
-
得到答案是取出圖中的節(jié)點然后過全連接層得到表示。
- 訓練集中的下一條和答案
spans
以及被提前取出來局待,因為答案只有一個斑响,所以答案的開始為1
,而一個句子中可以有k
個跳所以初始化為1/k
表示每個跳躍的概率是一樣的燎猛,但是這個模型只能建模一個paragraph
中只有一個跳的情況恋捆,那么就需要能夠很好的預測第一個跳的位置。 - 每個答案有兩個
negative
是random
從hop node
中提取出來出來的span
- 構(gòu)建圖的方法重绷,
x
是節(jié)點可以指向para
,para
中的supporting fact
中有片段和gold entity
以及answer
大致可以匹配到那么就將邊x,y
連接起來沸停,這個就是連接初始邊的方法,后面的方法都是可以推斷得到的昭卓。實際上是直接把clues
當成supporting fact
愤钾。
- 評估的時候不僅要把答案找到還要找到
supporting facts
,可解釋性就很強候醒。
-
還有一個表示邏輯推斷嚴格性的一個指標能颁。
-
GNN
真的很重要,直接提高了50%
倒淫。