K-鄰近算法
采用測量不同特征值之間的距離來進(jìn)行分類
- Ad:精度高,對異常值不敏感水慨,無數(shù)據(jù)輸入假定
- Na:計(jì)算復(fù)雜度高治宣,空間復(fù)雜度高
KNN原理
存在樣本集绊茧,每個(gè)數(shù)據(jù)都存在標(biāo)簽,輸入無標(biāo)簽的新數(shù)據(jù)后叶撒,算法提取出特征最相似的標(biāo)簽止剖。
一般選取前K個(gè)數(shù)據(jù)焙蚓,通常K不大于20宏浩,最后選擇K個(gè)最相似的數(shù)據(jù)中出現(xiàn)次數(shù)最多的分類,作為新數(shù)據(jù)的分類標(biāo)簽法竞。
適用
數(shù)值型和標(biāo)稱型
算法流程
收集數(shù)據(jù)
any method準(zhǔn)備數(shù)據(jù)
計(jì)算距離數(shù)值,最好為格式化的數(shù)據(jù)分析數(shù)據(jù)
any method訓(xùn)練算法
不適用KNN算法測試算法
計(jì)算錯誤率使用算法
實(shí)際應(yīng)用
?