KNN庫簡介

1.scikit-learn 中KNN相關(guān)的類庫

機(jī)器學(xué)習(xí)經(jīng)典庫scikit-learn中的sklearn.neighbors包集成了近鄰法相關(guān)的算法,KNN分類樹算法使用KNeighborsClassifier雳窟,回歸樹使用KNeighborsRegressor尊浪。除此之外,還有KNN的擴(kuò)展封救,即限定半徑最近鄰分類樹RadiusNeighborsClassifier和限定半徑最近鄰回歸樹RadiusNeighborsRegressor拇涤,以及最近質(zhì)心分類算法NearestCentroid。

在這些算法中誉结,KNN分類和回歸的類參數(shù)完全一樣鹅士。限定半徑最近鄰法分類和回歸的類的主要參數(shù)也和KNN基本一樣。比較特別是的最近質(zhì)心分類算法惩坑,由于它是直接選擇最近質(zhì)心來分類掉盅,所以僅有兩個參數(shù),距離度量和特征選擇距離閾值以舒。

限定半徑最近鄰算法怔接,即樣本中某系類別的樣本非常的少,甚至少于K稀轨,這導(dǎo)致稀有類別樣本在找K個最近鄰的時候扼脐,會把距離其實較遠(yuǎn)的其他樣本考慮進(jìn)來,而導(dǎo)致預(yù)測不準(zhǔn)確奋刽。為了解決這個問題瓦侮,我們限定最近鄰的一個最大距離,也就是說佣谐,我們只在一個距離范圍內(nèi)搜索所有的最近鄰肚吏,這避免了上述問題。這個距離我們一般稱為限定半徑狭魂。

最近質(zhì)心算法首先把樣本按輸出類別歸類罚攀。對于第 L類的Cl個樣本党觅。它會對這Cl個樣本的n維特征中每一維特征求平均值,最終該類別所有維度的n個平均值形成所謂的質(zhì)心點(diǎn)斋泄。對于樣本中的所有出現(xiàn)的類別杯瞻,每個類別會最終得到一個質(zhì)心點(diǎn)。當(dāng)我們做預(yù)測時炫掐,僅僅需要比較預(yù)測樣本和這些質(zhì)心的距離魁莉,最小的距離對于的質(zhì)心類別即為預(yù)測的類別。這個算法通常用在文本分類處理上募胃。

2.K近鄰法類庫參數(shù)小結(jié)

image.png

image.png

3. KNN算法的優(yōu)缺點(diǎn)

KNN的主要優(yōu)點(diǎn)有:

1) 理論成熟旗唁,思想簡單,既可以用來做分類也可以用來做回歸

2) 可用于非線性分類

3) 訓(xùn)練時間復(fù)雜度比支持向量機(jī)之類的算法低痹束,僅為O(n)

4) 和樸素貝葉斯之類的算法比检疫,對數(shù)據(jù)沒有假設(shè),準(zhǔn)確度高祷嘶,對異常點(diǎn)不敏感

5) 由于KNN方法主要靠周圍有限的鄰近的樣本电谣,而不是靠判別類域的方法來確定所屬類別的,因此對于類域的交叉或重疊較多的待分樣本集來說抹蚀,KNN方法較其他方法更為適合

6)該算法比較適用于樣本容量比較大的類域的自動分類剿牺,而那些樣本容量較小的類域采用這種算法比較容易產(chǎn)生誤分

KNN的主要缺點(diǎn)有:

1)計算量大,尤其是特征數(shù)非常多的時候

2)樣本不平衡的時候环壤,對稀有類別的預(yù)測準(zhǔn)確率低

3)KD樹晒来,球樹之類的模型建立需要大量的內(nèi)存

4)使用懶散學(xué)習(xí)方法,基本上不學(xué)習(xí)郑现,導(dǎo)致預(yù)測時速度比起邏輯回歸之類的算法慢

5)相比決策樹模型湃崩,KNN模型可解釋性不強(qiáng)

參考:

1.K近鄰法(KNN)原理小結(jié)

2.scikit-learn K近鄰法類庫使用小結(jié)

image.png

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市接箫,隨后出現(xiàn)的幾起案子攒读,更是在濱河造成了極大的恐慌,老刑警劉巖辛友,帶你破解...
    沈念sama閱讀 206,013評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件薄扁,死亡現(xiàn)場離奇詭異,居然都是意外死亡废累,警方通過查閱死者的電腦和手機(jī)邓梅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,205評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來邑滨,“玉大人日缨,你說我怎么就攤上這事∫纯矗” “怎么了匣距?”我有些...
    開封第一講書人閱讀 152,370評論 0 342
  • 文/不壞的土叔 我叫張陵面哥,是天一觀的道長。 經(jīng)常有香客問我毅待,道長尚卫,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,168評論 1 278
  • 正文 為了忘掉前任恩静,我火速辦了婚禮焕毫,結(jié)果婚禮上蹲坷,老公的妹妹穿的比我還像新娘驶乾。我一直安慰自己,他們只是感情好循签,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,153評論 5 371
  • 文/花漫 我一把揭開白布级乐。 她就那樣靜靜地躺著,像睡著了一般县匠。 火紅的嫁衣襯著肌膚如雪风科。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,954評論 1 283
  • 那天乞旦,我揣著相機(jī)與錄音贼穆,去河邊找鬼。 笑死兰粉,一個胖子當(dāng)著我的面吹牛故痊,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播玖姑,決...
    沈念sama閱讀 38,271評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼愕秫,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了焰络?” 一聲冷哼從身側(cè)響起戴甩,我...
    開封第一講書人閱讀 36,916評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎闪彼,沒想到半個月后甜孤,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,382評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡畏腕,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,877評論 2 323
  • 正文 我和宋清朗相戀三年课蔬,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片郊尝。...
    茶點(diǎn)故事閱讀 37,989評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡二跋,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出流昏,到底是詐尸還是另有隱情扎即,我是刑警寧澤吞获,帶...
    沈念sama閱讀 33,624評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站谚鄙,受9級特大地震影響各拷,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜闷营,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,209評論 3 307
  • 文/蒙蒙 一烤黍、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧傻盟,春花似錦速蕊、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,199評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至诽表,卻和暖如春唉锌,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背竿奏。 一陣腳步聲響...
    開封第一講書人閱讀 31,418評論 1 260
  • 我被黑心中介騙來泰國打工袄简, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人泛啸。 一個月前我還...
    沈念sama閱讀 45,401評論 2 352
  • 正文 我出身青樓绿语,卻偏偏與公主長得像,于是被迫代替她去往敵國和親平痰。 傳聞我的和親對象是個殘疾皇子汞舱,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,700評論 2 345