近鄰算法又稱為被動學(xué)習(xí)算法碱茁。這種算法只是將訓(xùn)練集的數(shù)據(jù)保存起來,在收到測試數(shù)據(jù)時(shí)才會進(jìn)行計(jì)算仿贬。 貝葉斯算法則是一種主動學(xué)習(xí)算法,它會根據(jù)訓(xùn)練集構(gòu)...

近鄰算法又稱為被動學(xué)習(xí)算法碱茁。這種算法只是將訓(xùn)練集的數(shù)據(jù)保存起來,在收到測試數(shù)據(jù)時(shí)才會進(jìn)行計(jì)算仿贬。 貝葉斯算法則是一種主動學(xué)習(xí)算法,它會根據(jù)訓(xùn)練集構(gòu)...
KNN 算法 k 近鄰算法( kNN ):考察新記錄周圍距離最近的 k 條記錄茧泪,而不是只看一條蜓氨。 每個(gè)近鄰都有投票權(quán)队伟,程序會將新紀(jì)錄判定為得票數(shù)...
訓(xùn)練集和測試集 通常我們將數(shù)據(jù)集分為兩個(gè)部分,第一部分用來構(gòu)造分類器嗜侮,因此稱為訓(xùn)練集港令;另一部分用來評估分類器的結(jié)果,因此稱為測試集棘钞。 訓(xùn)練集和測...
特征值選取 1、選擇特征值 2宜猜、對特征值相關(guān)度進(jìn)行評分 3泼返、將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化(最常用的方法時(shí)將所有數(shù)據(jù)都轉(zhuǎn)化為 0 到 1 之間的值姨拥,或使用標(biāo)準(zhǔn)...
Slope One 算法是在一篇名為《Slope One:基于在線評分系統(tǒng)的協(xié)同過濾算法》的論文中提出的绅喉,由 Lemire 和 Machlach...
基于用戶的協(xié)同過濾 基于用戶的協(xié)同過濾又稱為內(nèi)存型協(xié)同過濾叫乌,需要將所有數(shù)據(jù)都保存在內(nèi)存中進(jìn)行計(jì)算柴罐;我們將一個(gè)用戶和其他所有用戶進(jìn)行對比找到相似的...
找出相似用戶 曼哈頓距離 最簡單的距離計(jì)算方式憨奸; 在二維模型中革屠,每個(gè)目標(biāo)對象都可以用 (x, y) 的點(diǎn)來表示,我們可以用下標(biāo)來表示不同的對象排宰,...
聚類 通過物品特征來計(jì)算距離,并自動分類到不同的群集或組中党瓮。 層次聚類算法 對于層次聚類算法,我們不需要預(yù)先指定分類的數(shù)量盐类,這個(gè)算方法會將每條數(shù)...
非結(jié)構(gòu)化文本的分類算法 如身高寞奸、體重呛谜、對法案的投票等枪萄。具有能用表格來展現(xiàn) 的共性的數(shù)據(jù)我們稱為 “結(jié)構(gòu)化數(shù)據(jù)” 隐岛。數(shù)據(jù)集中的每條數(shù)據(jù)(下表中的一...