分詞練習(xí)

1、現(xiàn)有的分詞工具
中科院計(jì)算所NLPIR
ansj分詞器
哈工大的LTP
清華大學(xué)THULAC
斯坦福分詞器
Hanlp分詞器
結(jié)巴分詞
KCWS分詞器(字嵌入+Bi-LSTM+CRF)
ZPar
IKAnalyzer
2收班、MLPIR與jieba的對比
首先粤蝎,用MLPIR進(jìn)行線上的分詞分析侣监。

分詞分析的內(nèi)容為:
原版文字.png

而用MLPIR分詞得出的結(jié)果為:
MLPIR分詞png

然后用jieba分詞的結(jié)果為:
jieba源碼.png
jieba分詞.png

可以看出月褥,MLPIR在分詞的同時菊霜,把分詞結(jié)果的詞性也同時分離出來,而jieba的分詞結(jié)果只是單純的進(jìn)行了分詞谆刨;同時塘娶,MLPIR與jieba的分詞結(jié)果也顯示了兩個分詞工具有著不同的詞庫,例如“六道”在MLPIR的詞庫中是不存在的痊夭,所以它分出了“六”“道”刁岸,而jieba這是直接分出了“六道”這個詞。
3她我、jieba分詞練習(xí)
3.1關(guān)鍵詞的提取

源碼為:
關(guān)鍵詞提取源碼.png

運(yùn)行結(jié)果為:
關(guān)鍵詞提取結(jié)果.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末虹曙,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子番舆,更是在濱河造成了極大的恐慌酝碳,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,366評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件恨狈,死亡現(xiàn)場離奇詭異疏哗,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)禾怠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評論 3 395
  • 文/潘曉璐 我一進(jìn)店門返奉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人吗氏,你說我怎么就攤上這事芽偏。” “怎么了弦讽?”我有些...
    開封第一講書人閱讀 165,689評論 0 356
  • 文/不壞的土叔 我叫張陵哮针,是天一觀的道長。 經(jīng)常有香客問我坦袍,道長十厢,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,925評論 1 295
  • 正文 為了忘掉前任捂齐,我火速辦了婚禮蛮放,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘奠宜。我一直安慰自己包颁,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,942評論 6 392
  • 文/花漫 我一把揭開白布压真。 她就那樣靜靜地躺著娩嚼,像睡著了一般。 火紅的嫁衣襯著肌膚如雪滴肿。 梳的紋絲不亂的頭發(fā)上岳悟,一...
    開封第一講書人閱讀 51,727評論 1 305
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼贵少。 笑死呵俏,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的滔灶。 我是一名探鬼主播普碎,決...
    沈念sama閱讀 40,447評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼录平!你這毒婦竟也來了麻车?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,349評論 0 276
  • 序言:老撾萬榮一對情侶失蹤斗这,失蹤者是張志新(化名)和其女友劉穎动猬,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體涝影,經(jīng)...
    沈念sama閱讀 45,820評論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡枣察,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,990評論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了燃逻。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片序目。...
    茶點(diǎn)故事閱讀 40,127評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖伯襟,靈堂內(nèi)的尸體忽然破棺而出猿涨,到底是詐尸還是另有隱情,我是刑警寧澤姆怪,帶...
    沈念sama閱讀 35,812評論 5 346
  • 正文 年R本政府宣布叛赚,位于F島的核電站,受9級特大地震影響稽揭,放射性物質(zhì)發(fā)生泄漏俺附。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,471評論 3 331
  • 文/蒙蒙 一溪掀、第九天 我趴在偏房一處隱蔽的房頂上張望事镣。 院中可真熱鬧,春花似錦揪胃、人聲如沸璃哟。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,017評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽随闪。三九已至,卻和暖如春骚勘,著一層夾襖步出監(jiān)牢的瞬間铐伴,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,142評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留盛杰,地道東北人挽荡。 一個月前我還...
    沈念sama閱讀 48,388評論 3 373
  • 正文 我出身青樓藐石,卻偏偏與公主長得像即供,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子于微,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,066評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 1.常用的分詞工具包 perminusminusStanford 漢語分詞工具哈工大語言云ICTCLAS——Ans...
    雞肉卷福閱讀 680評論 0 0
  • 在接下來的分詞練習(xí)中將使用到四川大學(xué)公共管理學(xué)院的一篇新聞進(jìn)行練習(xí)逗嫡,文本如下: 為貫徹落實(shí)黨的十九大精神,不斷提升...
    nicokani閱讀 1,233評論 0 4
  • 關(guān)于分詞工具包的體驗(yàn):分詞練習(xí)2——分詞體驗(yàn) 現(xiàn)有的分詞工具包 (1)NLPIR NLPIR漢語分詞系統(tǒng)株依,又名IC...
    駱落啊閱讀 1,005評論 0 6
  • 常用概念: 自然語言處理(NLP) 數(shù)據(jù)挖掘 推薦算法 用戶畫像 知識圖譜 信息檢索 文本分類 常用技術(shù): 詞級別...
    御風(fēng)之星閱讀 9,184評論 1 25
  • 使用ICTCLAS(NLPIR)在線分詞工具和jieba分詞組件進(jìn)行分詞練習(xí)驱证。 一. ICTCLAS 1.簡介 漢...
    Carina_55閱讀 734評論 0 1