<Paper Reading Series>
本文基于文章:Neural Chinese Medical Named Entity Recognition with Dictionary Knowledge
- 研究背景
- 前人的解決方式
- 模型核心思想
- 具體實現(xiàn)細(xì)節(jié)
- 實驗結(jié)果
- 結(jié)論
研究背景
TODO
前人的解決方式
TODO
模型核心思想
在普通的BiLSTM+CRF的NER框架基礎(chǔ)上傲须,加入針對中文的額外編碼方式和醫(yī)學(xué)領(lǐng)域詞典信息趟脂,進(jìn)一步增強了模型的表現(xiàn)。
具體實現(xiàn)細(xì)節(jié)
模型總框架
- 亮點1:
除了character embedding外菇绵,增加了中文偏旁編碼和拼音編碼的方式,將所有embedding方式concat咬最,然后輸入編碼器永乌。 - 亮點2:
利用NER詞典進(jìn)行增強。
詞典示例如下:
“下肢”:body parts
“水腫”:symptom
...
增強方式分為兩種:模式匹配和共同訓(xùn)練
1. 模式匹配
基于準(zhǔn)確的模式匹配翅雏,直接得到input sentence的 Term Matching Embedding,加入joint embedding集合绩脆。
2.共同訓(xùn)練
由于文本中某些信息和dictionary中是同一個意思橄抹,但是不完全相同,模式匹配無法匹配到楼誓,因此采用共同訓(xùn)練的方式,即通過訓(xùn)練使CNN layer學(xué)到詞典中NER的knowledge主守。
實驗結(jié)果
TODO
結(jié)論
TODO