最近使用中文維基百科數(shù)據(jù)訓(xùn)練Word2Vec時(shí)囱晴,發(fā)現(xiàn)數(shù)據(jù)里面包含了很多繁體字照皆,這就很尷尬了换衬。這時(shí)候就知道OpenCC的強(qiáng)大了。哈哈噩茄,本來打算直接使用python里面的open...
最近使用中文維基百科數(shù)據(jù)訓(xùn)練Word2Vec時(shí)囱晴,發(fā)現(xiàn)數(shù)據(jù)里面包含了很多繁體字照皆,這就很尷尬了换衬。這時(shí)候就知道OpenCC的強(qiáng)大了。哈哈噩茄,本來打算直接使用python里面的open...
利用Python機(jī)器學(xué)習(xí)框架scikit-learn,我們自己做一個(gè)分類模型徽龟,對(duì)中文評(píng)論信息做情感分析。其中還會(huì)介紹中文停用詞的處理方法唉地。 疑惑 前些日子据悔,我在微信后臺(tái)收到了...