2021-03-01

Analyzing the Effect of Multi-task Learning for Biomedical Named Entity Recognition

  • 貢獻:
    1.分析生物醫(yī)學實體數(shù)據(jù)集之間的可轉移性漠酿,并找到一些有用的特性和方法來預測這些數(shù)據(jù)集之間的可轉移性奸忽,減少了今后尋找輔助數(shù)據(jù)集的工作量
    2.將遷移學習和多任務學習結合起來任柜,提高BioNER系統(tǒng)的性能
  • 分析數(shù)據(jù)集之間的可轉移性:
    為了了解多任務學習在哪種條件下能帶來更大的增益,作者總共使用了12個數(shù)據(jù)集度量暂雹。
    1.共享詞匯(有向):在輔助數(shù)據(jù)集詞匯表中找到目標數(shù)據(jù)集詞匯的比率
    2.主題分布相似度(無向):用LDA主體建模方法得到一個n維向量,用該向量去表示一個數(shù)據(jù)集的主題分布,用余弦相似度計算兩個數(shù)據(jù)集主題嵌入之間的相似度
    3.嵌入相似度(bert)(無向):先計算一個數(shù)據(jù)集中所有句子的bert嵌入表示驼壶,取平均收苏,用余弦相似度計算兩個數(shù)據(jù)集嵌入之間的相似度
    4.共現(xiàn)實體比(有向):在輔助數(shù)據(jù)集中找到并標記目標數(shù)據(jù)集實體的比率
  • 評估指標
    為了評估每種方法(上面所列舉的4種特征和它們的兩兩組合)的有用性亿卤,作者使用了3種不同的評估指標
    1.歸一化折現(xiàn)累積增益(NDGG)
    2.最佳輔助數(shù)據(jù)集的平均排名
    3.最佳輔助預測的平均排名
  • 實驗結果:


    多任務學習與單任務學習和SOTA結果的比較
  • 結論與分析:
    1.除了BC5CDR數(shù)據(jù)集,其他6個數(shù)據(jù)集多任務學習相比單任務學習對目標任務都有正向加成
    2.JNLPBA和BC2GM都包含基因/蛋白質的實體標注鹿霸,所以當使用BC2GM作為輔助數(shù)據(jù)集排吴,JNLPBA作為目標數(shù)據(jù)集時,超過了SOTA的性能懦鼠,但反過來钻哩,BC2GM作為目標數(shù)據(jù)集,而JNLPBA作為輔助數(shù)據(jù)集時肛冶,性能卻最差
  • 數(shù)據(jù)集大小和數(shù)據(jù)集中entity/token的比率與MTL增益的相關性:



    結論和分析:
    1.輔助數(shù)據(jù)集大小與MTL增益成負相關
    2.目標數(shù)據(jù)集entity/token的比率與MTL增益成負相關街氢,而輔助數(shù)據(jù)集成正相關,說明目標數(shù)據(jù)集中實體標注稀疏而輔助數(shù)據(jù)集中實體標注豐富更有可能對MTL增益起作用

  • 衡量所有相似度度量的goodness



    結論和分析:
    1.cooccur相似度度量的NDGG得分最高
    2.topic相似度度量的最佳輔助數(shù)據(jù)集排名最高睦袖,而且它與其他相似度度量的結合占據(jù)了最佳輔助數(shù)據(jù)集排名的前4位珊肃。這表明,基于主題相似度信息對尋找最佳輔助數(shù)據(jù)集是非常有用的,LDA模型獲得的基于主題的相似性分數(shù)是MTL增益一個很好的預測器

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末近范,一起剝皮案震驚了整個濱河市嘶摊,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌评矩,老刑警劉巖叶堆,帶你破解...
    沈念sama閱讀 218,525評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異斥杜,居然都是意外死亡虱颗,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,203評論 3 395
  • 文/潘曉璐 我一進店門蔗喂,熙熙樓的掌柜王于貴愁眉苦臉地迎上來忘渔,“玉大人,你說我怎么就攤上這事缰儿∑枇福” “怎么了?”我有些...
    開封第一講書人閱讀 164,862評論 0 354
  • 文/不壞的土叔 我叫張陵乖阵,是天一觀的道長宣赔。 經常有香客問我,道長瞪浸,這世上最難降的妖魔是什么儒将? 我笑而不...
    開封第一講書人閱讀 58,728評論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮对蒲,結果婚禮上钩蚊,老公的妹妹穿的比我還像新娘。我一直安慰自己蹈矮,他們只是感情好砰逻,可當我...
    茶點故事閱讀 67,743評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著含滴,像睡著了一般诱渤。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上谈况,一...
    開封第一講書人閱讀 51,590評論 1 305
  • 那天勺美,我揣著相機與錄音,去河邊找鬼碑韵。 笑死赡茸,一個胖子當著我的面吹牛,可吹牛的內容都是我干的祝闻。 我是一名探鬼主播占卧,決...
    沈念sama閱讀 40,330評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼遗菠,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了华蜒?” 一聲冷哼從身側響起辙纬,我...
    開封第一講書人閱讀 39,244評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎叭喜,沒想到半個月后贺拣,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 45,693評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡捂蕴,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,885評論 3 336
  • 正文 我和宋清朗相戀三年譬涡,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片啥辨。...
    茶點故事閱讀 40,001評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡涡匀,死狀恐怖,靈堂內的尸體忽然破棺而出溉知,到底是詐尸還是另有隱情陨瘩,我是刑警寧澤,帶...
    沈念sama閱讀 35,723評論 5 346
  • 正文 年R本政府宣布着倾,位于F島的核電站拾酝,受9級特大地震影響,放射性物質發(fā)生泄漏卡者。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,343評論 3 330
  • 文/蒙蒙 一客们、第九天 我趴在偏房一處隱蔽的房頂上張望崇决。 院中可真熱鬧,春花似錦底挫、人聲如沸恒傻。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,919評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至盗胀,卻和暖如春官边,著一層夾襖步出監(jiān)牢的瞬間沸手,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,042評論 1 270
  • 我被黑心中介騙來泰國打工注簿, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留契吉,地道東北人。 一個月前我還...
    沈念sama閱讀 48,191評論 3 370
  • 正文 我出身青樓诡渴,卻偏偏與公主長得像捐晶,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,955評論 2 355

推薦閱讀更多精彩內容