IP屬地:山西
學(xué)習(xí)目標(biāo) 1. 文本聚類(lèi)概念 Explain the concept of text clustering and why it is usef...
一 概率主題模型 1.1 混合語(yǔ)言模型 如何擺脫背景詞(數(shù)據(jù)中頻率高)——常見(jiàn)詞不應(yīng)用分布解釋 背景主題模型:生成常用詞匯 使用另個(gè)分布:需決定...
文本挖掘第二彈 本周目標(biāo) 正式上車(chē) 一 組合關(guān)系發(fā)現(xiàn)和熵(單詞關(guān)聯(lián)挖掘) 1.1熵函數(shù) 一個(gè)詞相隨出現(xiàn)的概率定義: 熵函數(shù):表示預(yù)測(cè)有多困難(0...