KNN的基本思想
? ? 根據(jù)距離函數(shù)計(jì)算待分類樣本X和每個(gè)訓(xùn)練樣本的距離(作為相似度),選擇與待分類樣本距離最小的K個(gè)樣本作為X的K個(gè)最近鄰膛薛,最后以X的K個(gè)最近鄰中的大多數(shù)所屬的類別作為X的類別初肉。
KNN算法的實(shí)現(xiàn)
? ? 對未知類別屬性的數(shù)據(jù)集中的每個(gè)點(diǎn)依次執(zhí)行以下操作:
1.計(jì)算已知類別的數(shù)據(jù)集中的點(diǎn)與當(dāng)前點(diǎn)之間的距離析校。
2.按照距離遞增次序排序
3.選取與當(dāng)前點(diǎn)距離最小的k個(gè)點(diǎn)
4.確定前k個(gè)點(diǎn)所在類別的出現(xiàn)頻率
5.返回前k個(gè)點(diǎn)出現(xiàn)頻率最高的類別作為當(dāng)前點(diǎn)的預(yù)測分類皿哨。