Learning to Ask: Neural Question Generation for Reading Comprehension

1. 背景介紹

Question Generation是指根據(jù)“一段文字”生成“問題”,即像閱讀理解的題目一樣。其主要的應(yīng)用場景是“教育”叉钥,方便讀者深入理解一段文字罢缸,也為外語初學(xué)者等提供更多的學(xué)習(xí)材料;另外也可以被應(yīng)用于對話生成中投队,即生成追問問題;也可以充當醫(yī)生的角色,詢問患者一些基本問題吗铐。但是目前這項研究的主要應(yīng)用場景是生成更多的數(shù)據(jù)來提升Reading Comprehension和QA的效果妒峦。

Question Generation和其他的NLP任務(wù)一樣,并不簡單扒披,比如說下面的例子中:

Sentence:
Oxygen is used in cellular respiration and released by photosynthesis, which uses the energy of sunlight to produce oxygen from water.

Questions:

  1. What life process produces oxygen in the presence of light? (photosynthesis)
  2. Photosynthesis uses which energy to form oxygen from water? (sunlight)
  3. From what does photosynthesis get oxygen? (water)

第一個問題中用到了常識信息photosynthesis是一種life process值依;
第二個問題中使用了近義詞form代替produce;
第三個問題是對原句的一個倒置碟案。
可見生成問題要考慮的情況有很多愿险,是一個相對比較復(fù)雜的任務(wù),需要對原文段進行抽象和重述蟆淀。

大部分方法在做Question Generation的時候拯啦,一般經(jīng)過兩個步驟,第一熔任,把raw text (sentence or paragraph)轉(zhuǎn)換成某種syntactic representation (parsing tree)褒链;第二,把syntactic representation套入某個人工采集的template (問題模式)中疑苔,生成句子甫匹。這種傳統(tǒng)的方法主要有三個不足:第一,人工采集template是費時費力的惦费;第二兵迅,基于template的問題不夠多樣,比較死板薪贫;第三恍箭,分了太多的步驟 (too many pipelines)。

于是本文提出了用sequence-to-sequence模型來解決問題瞧省,即像機器翻譯一樣扯夭,把raw text看成是源語言,把question看成是目標語言鞍匾,然后相當于是進行翻譯交洗。

1.1 推薦歷史閱讀

Lucy Vanderwende. 2008. The importance of being important: Question generation. https://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/Lucy_Vanderwende_NSF_question_gen.pdf

Michael Heilman and Noah A. Smith. 2010. Good question! statistical ranking for question generation. http://www.aclweb.org/anthology/N10-1086

2. 模型構(gòu)建

這里不再詳細介紹sequence-to-seqence模型了,直接上圖橡淑。

seq2seq_model.png

首先用雙向RNN(BiRNN)編碼整個句子构拳,然后再用attention機制對編碼后的句子進行側(cè)重點標注,接著送入decoder中,輸出問題置森。

論文中對于h_0的初始化斗埂,用了兩種方式:
第一種是只使用了sentence embedding對h_0進行初始化,如圖中所示凫海,即:


sentence-level.png

第二種是用這個編碼模型同時對句子和句子所在的文段進行編碼蜜笤,然后將編碼結(jié)果進行concatenate,然后初始化h_0盐碱,即:


paragraph-level.png

3. 部分實驗結(jié)果呈現(xiàn)

results.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末把兔,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子瓮顽,更是在濱河造成了極大的恐慌县好,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,290評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件暖混,死亡現(xiàn)場離奇詭異缕贡,居然都是意外死亡,警方通過查閱死者的電腦和手機拣播,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,107評論 2 385
  • 文/潘曉璐 我一進店門晾咪,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人贮配,你說我怎么就攤上這事谍倦。” “怎么了泪勒?”我有些...
    開封第一講書人閱讀 156,872評論 0 347
  • 文/不壞的土叔 我叫張陵昼蛀,是天一觀的道長。 經(jīng)常有香客問我圆存,道長叼旋,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,415評論 1 283
  • 正文 為了忘掉前任沦辙,我火速辦了婚禮夫植,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘油讯。我一直安慰自己详民,他們只是感情好,可當我...
    茶點故事閱讀 65,453評論 6 385
  • 文/花漫 我一把揭開白布撞羽。 她就那樣靜靜地躺著阐斜,像睡著了一般衫冻。 火紅的嫁衣襯著肌膚如雪诀紊。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,784評論 1 290
  • 那天,我揣著相機與錄音邻奠,去河邊找鬼笤喳。 笑死,一個胖子當著我的面吹牛碌宴,可吹牛的內(nèi)容都是我干的杀狡。 我是一名探鬼主播,決...
    沈念sama閱讀 38,927評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼贰镣,長吁一口氣:“原來是場噩夢啊……” “哼呜象!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起碑隆,我...
    開封第一講書人閱讀 37,691評論 0 266
  • 序言:老撾萬榮一對情侶失蹤恭陡,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后上煤,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體休玩,經(jīng)...
    沈念sama閱讀 44,137評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,472評論 2 326
  • 正文 我和宋清朗相戀三年劫狠,在試婚紗的時候發(fā)現(xiàn)自己被綠了拴疤。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,622評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡独泞,死狀恐怖呐矾,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情懦砂,我是刑警寧澤凫佛,帶...
    沈念sama閱讀 34,289評論 4 329
  • 正文 年R本政府宣布,位于F島的核電站孕惜,受9級特大地震影響愧薛,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜衫画,卻給世界環(huán)境...
    茶點故事閱讀 39,887評論 3 312
  • 文/蒙蒙 一毫炉、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧削罩,春花似錦瞄勾、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至微服,卻和暖如春趾疚,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工糙麦, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留辛孵,地道東北人。 一個月前我還...
    沈念sama閱讀 46,316評論 2 360
  • 正文 我出身青樓赡磅,卻偏偏與公主長得像魄缚,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子焚廊,可洞房花燭夜當晚...
    茶點故事閱讀 43,490評論 2 348

推薦閱讀更多精彩內(nèi)容