1、現(xiàn)有的分詞工具
中科院計(jì)算所NLPIR
ansj分詞器
哈工大的LTP
清華大學(xué)THULAC
斯坦福分詞器
Hanlp分詞器
結(jié)巴分詞
KCWS分詞器(字嵌入+Bi-LSTM+CRF)
ZPar
IKAnalyzer
2收班、MLPIR與jieba的對比
首先粤蝎,用MLPIR進(jìn)行線上的分詞分析侣监。
原版文字.png
而用MLPIR分詞得出的結(jié)果為:
MLPIR分詞png
然后用jieba分詞的結(jié)果為:
jieba源碼.png
jieba分詞.png
可以看出月褥,MLPIR在分詞的同時菊霜,把分詞結(jié)果的詞性也同時分離出來,而jieba的分詞結(jié)果只是單純的進(jìn)行了分詞谆刨;同時塘娶,MLPIR與jieba的分詞結(jié)果也顯示了兩個分詞工具有著不同的詞庫,例如“六道”在MLPIR的詞庫中是不存在的痊夭,所以它分出了“六”“道”刁岸,而jieba這是直接分出了“六道”這個詞。
3她我、jieba分詞練習(xí)
3.1關(guān)鍵詞的提取
關(guān)鍵詞提取源碼.png
運(yùn)行結(jié)果為:
關(guān)鍵詞提取結(jié)果.png