最近使用中文維基百科數(shù)據(jù)訓(xùn)練Word2Vec時囊蓝,發(fā)現(xiàn)數(shù)據(jù)里面包含了很多繁體字饿悬,這就很尷尬了。這時候就知道OpenCC的強(qiáng)大了聚霜。哈哈狡恬,本來打算直接使用python里面的open...
![240](https://cdn2.jianshu.io/assets/default_avatar/14-0651acff782e7a18653d7530d6b27661.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
IP屬地:貴州
最近使用中文維基百科數(shù)據(jù)訓(xùn)練Word2Vec時囊蓝,發(fā)現(xiàn)數(shù)據(jù)里面包含了很多繁體字饿悬,這就很尷尬了。這時候就知道OpenCC的強(qiáng)大了聚霜。哈哈狡恬,本來打算直接使用python里面的open...
利用Python機(jī)器學(xué)習(xí)框架scikit-learn弟劲,我們自己做一個分類模型,對中文評論信息做情感分析姥芥。其中還會介紹中文停用詞的處理方法兔乞。 疑惑 前些日子,我在微信后臺收到了...