![240](https://cdn2.jianshu.io/assets/default_avatar/15-a7ac401939dd4df837e3bbf82abaa2a8.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
IP屬地:山西
學(xué)習(xí)目標(biāo) 1. 文本聚類概念 Explain the concept of text clustering and why it is usef...
一 概率主題模型 1.1 混合語言模型 如何擺脫背景詞(數(shù)據(jù)中頻率高)——常見詞不應(yīng)用分布解釋 背景主題模型:生成常用詞匯 使用另個分布:需決定...
文本挖掘第二彈 本周目標(biāo) 正式上車 一 組合關(guān)系發(fā)現(xiàn)和熵(單詞關(guān)聯(lián)挖掘) 1.1熵函數(shù) 一個詞相隨出現(xiàn)的概率定義: 熵函數(shù):表示預(yù)測有多困難(0...