- K nearest neighbour (KNN)
- 定義:在一個數(shù)據(jù)集中,通過最近鄰居將數(shù)據(jù)分類。
- Distance metrics可以是Euclidean, city block, cosine, Chebychev等。
- 無參數(shù)
- 優(yōu)點:簡單,合邏輯
- 缺點: 通過k來決定結(jié)果殖蚕,可能k的選擇不好夏醉;
通常k越大岗憋,分類過程中的噪聲影響越小绪颖,但類之間的邊界也變得不清晰抡笼; 算法的準(zhǔn)確率常常會被不相干特征或者噪聲影響苏揣,以至于結(jié)果很糟糕;二類分類問題中推姻,k為奇數(shù)常常能避免票數(shù)平等平匈;嘗試不同的k來檢查敏感性,很重要。