@ioiogoo 謝謝娇跟!我找到了用string庫的punctuation做匹配,也好用的虫碉,等下再試試您的方法。
使用K-means及TF-IDF算法對中文文本聚類并可視化點擊查看原文 對于無監(jiān)督學(xué)習(xí)來說胸梆,聚類算法對于數(shù)據(jù)挖掘敦捧、NLP處理等方向都有著非常重要的地位。常見的聚類算法比如K-means碰镜、BIRCH(Balanced Iterativ...
@ioiogoo 謝謝娇跟!我找到了用string庫的punctuation做匹配,也好用的虫碉,等下再試試您的方法。
使用K-means及TF-IDF算法對中文文本聚類并可視化點擊查看原文 對于無監(jiān)督學(xué)習(xí)來說胸梆,聚類算法對于數(shù)據(jù)挖掘敦捧、NLP處理等方向都有著非常重要的地位。常見的聚類算法比如K-means碰镜、BIRCH(Balanced Iterativ...
請問去掉標(biāo)點符號時用到的remove_punc兢卵, 是您自己寫的方法嗎?是否能提供代碼呢绪颖?
使用K-means及TF-IDF算法對中文文本聚類并可視化點擊查看原文 對于無監(jiān)督學(xué)習(xí)來說秽荤,聚類算法對于數(shù)據(jù)挖掘、NLP處理等方向都有著非常重要的地位柠横。常見的聚類算法比如K-means窃款、BIRCH(Balanced Iterativ...