論文閱讀:
《Knowledge-enhanced biomedical named entity recognition and normalization: application to proteins and genes》
-
動(dòng)機(jī):
由于實(shí)體名稱的變化和模糊性醋拧,一個(gè)生物醫(yī)學(xué)實(shí)體可能有多個(gè)變體宫峦,一個(gè)變體可以表示多個(gè)不同的實(shí)體標(biāo)識(shí)符抖所。而這些情況都可能會(huì)導(dǎo)致最后實(shí)體識(shí)別的結(jié)果出錯(cuò)裤纹,因此作者為了解決這些問(wèn)題蛇更,提出了一種新的知識(shí)增強(qiáng)系統(tǒng)伏蚊,用于蛋白質(zhì)/基因的命名實(shí)體識(shí)別和實(shí)體規(guī)范化。一方面,從生物醫(yī)學(xué)知識(shí)庫(kù)中提取大量的實(shí)體名稱知識(shí)來(lái)識(shí)別更多的實(shí)體變量礼搁,另一方面,提取實(shí)體的結(jié)構(gòu)知識(shí)并將其編碼為標(biāo)識(shí)符(ID)嵌入目尖,然后將其用于實(shí)體規(guī)范化馒吴。
存在的兩個(gè)典型問(wèn)題
-
貢獻(xiàn):
1.將Elmo應(yīng)用于實(shí)體識(shí)別和規(guī)范化
2.將實(shí)體的結(jié)構(gòu)知識(shí)集成到ID嵌入中,有利于解決PNEN所面臨的實(shí)體歧義問(wèn)題
3.實(shí)體名稱知識(shí)瑟曲,可以用于更好地解決名稱變化問(wèn)題的前向線索饮戳,也被應(yīng)用到系統(tǒng)中