選項(xiàng)評估論文閱讀

數(shù)據(jù)集

RACE數(shù)據(jù)集

RACE: Large-scale ReAding Comprehension Dataset From Examinations阱驾,相關(guān)介紹可參考:http://www.reibang.com/p/7040a76d56a7

SciQ數(shù)據(jù)集

Crowdsourcing Multiple Choice Science Questions吉执,相關(guān)介紹可參考:http://www.reibang.com/p/2de4acd1cbf4

論文閱讀

1.Ranking Distractors for Multiple Choice Questions Using Multichannel Semantically Informed CNN-LSTM Networks

1.該文思想是將選項(xiàng)評估問題堪稱推薦系統(tǒng)中的排序問題涕蚤,默認(rèn)題目中正確答案和三個(gè)干擾選項(xiàng)排序應(yīng)在其他候選選項(xiàng)之前,使用排序算法的評估方式p@3乘寒、MAP望众、NDGG、MRR在數(shù)據(jù)集RACE和SciQ上進(jìn)行評估伞辛,兩個(gè)數(shù)據(jù)集P@3最高53%烂翰。

2.論文使用的模型是將問題、準(zhǔn)確答案蚤氏、問題相關(guān)的上下文甘耿、候選干擾選項(xiàng)分別通過CNN和BiLSTM編碼,另外竿滨,對上述四個(gè)元素的詞相似度矩陣使用CNN操作佳恬,得到相似語義模式編碼,并與CNN于游、BiLSTM編碼毁葱,共三個(gè)編碼向量進(jìn)行拼接,后接三個(gè)全連接層贰剥,最終得出各候選干擾項(xiàng)的分?jǐn)?shù)分布進(jìn)行排序倾剿。

2.Automatic Distractor Suggestion for Multiple-Choice Tests Using Concept Embeddings and Information Retrieval(2018 acl)

1.論文提出一種基于醫(yī)學(xué)領(lǐng)域本體UMLS,使用概念向量進(jìn)行語義相似度計(jì)算(候選概念與(正確答案+問題)的相似度)蚌成,獲取top n(文中500)個(gè)候選前痘;使用問題作為搜索詞,使用候選在搜索引擎Lucene中出現(xiàn)的第一篇文章的排序位置為候選進(jìn)行重排序担忧,得到最終top k個(gè)推薦干擾項(xiàng)芹缔。

2.論文通過計(jì)算推薦干擾項(xiàng)在最終真實(shí)干擾項(xiàng)中命中的情況進(jìn)行干擾項(xiàng)生成的自動評估。實(shí)驗(yàn)結(jié)果顯示瓶盛,當(dāng)推薦干擾項(xiàng)為top 20時(shí)乖菱,推薦的干擾項(xiàng)命中實(shí)際干擾項(xiàng)的概率為20%(此處分母為出現(xiàn)在UMLS中的干擾項(xiàng)數(shù))

3.論文提到了另一種干擾項(xiàng)評估思路:使用學(xué)生答題情況來評價(jià)干擾項(xiàng)的質(zhì)量坡锡,如果沒人選的干擾項(xiàng)蓬网,其質(zhì)量就較差

3.Semantic similarity of distractors in multiple-choice tests- extrinsic evaluation(2009 acl)

1.論文使用了幾種干擾項(xiàng)的生成策略(搭配模版窒所、基于wordnet的四種語義相似度計(jì)算方法、分布相似性帆锋、發(fā)音相似性吵取、綜合方法),生成后由老師進(jìn)行修改锯厢,通過學(xué)生的作答情況對題目難度皮官、干擾項(xiàng)的效果進(jìn)行評估。

2.將學(xué)生作答按照高低分分組实辑,高分一組(前三分之一)捺氢,低分一組(后三分之一),對比兩組數(shù)據(jù)的各項(xiàng)指標(biāo)(題目難度剪撬、題目區(qū)分能力摄乒、干擾項(xiàng)的有效性),進(jìn)行生成效果的評估残黑。

3.其中馍佑,干擾項(xiàng)的有效性評估:認(rèn)為好的干擾項(xiàng)應(yīng)該更吸引低分用戶選擇(相對于高分組);如果一個(gè)干擾項(xiàng)更吸引高分組用戶選擇梨水,則被認(rèn)為poor拭荤;如果一個(gè)干擾項(xiàng)無人選擇,則被認(rèn)為not-useful疫诽。實(shí)驗(yàn)結(jié)果表明舅世,混合方案可以達(dá)到最好的效果,有89%的干擾項(xiàng)可以滿足該特性奇徒。

《待擴(kuò)充》

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末雏亚,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子逼龟,更是在濱河造成了極大的恐慌评凝,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,718評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件腺律,死亡現(xiàn)場離奇詭異奕短,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)匀钧,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,683評論 3 385
  • 文/潘曉璐 我一進(jìn)店門翎碑,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人之斯,你說我怎么就攤上這事日杈。” “怎么了?”我有些...
    開封第一講書人閱讀 158,207評論 0 348
  • 文/不壞的土叔 我叫張陵莉擒,是天一觀的道長酿炸。 經(jīng)常有香客問我,道長涨冀,這世上最難降的妖魔是什么填硕? 我笑而不...
    開封第一講書人閱讀 56,755評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮鹿鳖,結(jié)果婚禮上扁眯,老公的妹妹穿的比我還像新娘。我一直安慰自己翅帜,他們只是感情好姻檀,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,862評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著涝滴,像睡著了一般恃慧。 火紅的嫁衣襯著肌膚如雪菊匿。 梳的紋絲不亂的頭發(fā)上形用,一...
    開封第一講書人閱讀 50,050評論 1 291
  • 那天皆愉,我揣著相機(jī)與錄音,去河邊找鬼腋妙。 笑死默怨,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的骤素。 我是一名探鬼主播匙睹,決...
    沈念sama閱讀 39,136評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼济竹!你這毒婦竟也來了痕檬?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,882評論 0 268
  • 序言:老撾萬榮一對情侶失蹤送浊,失蹤者是張志新(化名)和其女友劉穎梦谜,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體袭景,經(jīng)...
    沈念sama閱讀 44,330評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡唁桩,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,651評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了耸棒。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片荒澡。...
    茶點(diǎn)故事閱讀 38,789評論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖与殃,靈堂內(nèi)的尸體忽然破棺而出单山,到底是詐尸還是另有隱情碍现,我是刑警寧澤,帶...
    沈念sama閱讀 34,477評論 4 333
  • 正文 年R本政府宣布米奸,位于F島的核電站昼接,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏躏升。R本人自食惡果不足惜辩棒,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,135評論 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望膨疏。 院中可真熱鬧,春花似錦钻弄、人聲如沸佃却。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,864評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽饲帅。三九已至,卻和暖如春瘤泪,著一層夾襖步出監(jiān)牢的瞬間灶泵,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,099評論 1 267
  • 我被黑心中介騙來泰國打工对途, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留赦邻,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,598評論 2 362
  • 正文 我出身青樓实檀,卻偏偏與公主長得像惶洲,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子膳犹,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,697評論 2 351