《機器學習實戰(zhàn)》學習筆記 k-近鄰算法

算法執(zhí)行步驟:
對未知類別屬性的數(shù)據(jù)集中的每個點依次執(zhí)行以下操作:
1)計算已知類別數(shù)據(jù)集中的點與當前點之間的距離缰犁;
2)按照距離遞增次序進行排序;
3)選取與當前點距離最小的k個點垛叨;
4)確定前k個點所在類別的出現(xiàn)頻率迅腔;
5)返回前k個點出現(xiàn)頻率最高的類別作為當前點的預測分類装畅。
k的取值不大于20
適用于數(shù)值型和標稱型數(shù)據(jù)的分類
不需要提前訓練,即用即練沧烈。

實現(xiàn)代碼如下:

from numpy import *
import operator

def createDataSet():
    group = array([[1.0, 1.1], [1.0, 1.0], [0, 0],[0, 0.1]])
    labels = ['A', 'A', 'B', 'B']
    return group, labels

def classify(intX, dataSet, labels, k):
    dataSetSize = dataSet.shape[0]    #shape函數(shù)是numpy.core.fromnumeric中的函數(shù)掠兄,它的功能是查看矩陣或者數(shù)組的維數(shù)
    diffMat = tile(intX, (dataSetSize, 1)) - dataSet    #tile(A, B),將A按B的格式要求進行重復,B可以是int(此時在列上重復徽千,行默認重復一次)
                                                       #若B為元祖(a,b)苫费,則在行上重復a次,列上重復b次
    sqDiffMat = diffMat ** 2
    sqDistances = sqDiffMat.sum(axis=1)    #axis=0表示按列相加双抽,axis=1表示按照行相加
    distances = sqDistances ** 0.5
    sortedDistIndicies = distances.argsort()    #得到數(shù)組值從小到大的索引值
    #print(sortedDistIndicies)
    classCount = {}
    for i in range(k):
        voteLabel = labels[sortedDistIndicies[i]]
        classCount[voteLabel] = classCount.get(voteLabel, 0) + 1    #get()返回指定鍵的值百框, 如果指定鍵的值不存在時,返回默認值值(此處為0)
                                                                    #此處即為記錄每個入選標簽在所有入選標簽中出現(xiàn)的次數(shù)
    sortedClassCount = sorted(classCount.items(), key = operator.itemgetter(1), reverse=True)    #items() 函數(shù)以列表返回可遍歷的(鍵,值)元組
    return sortedClassCount[0][0]

if __name__ == '__main__':
    group, labels = createDataSet()
    result = classify([0, 0], group, labels, 3)
    print(result)

執(zhí)行結(jié)果

[2 3 1 0]
B

上面是k-近鄰算法的基本實現(xiàn)牍汹,為了完全理解算法在實際過程中的應(yīng)用铐维,還做了個有關(guān)約會對象是否為理想對象的實戰(zhàn)練習,源碼:https://github.com/YanniYao/algorithm_in_machine_learning/tree/master/kNN_exercise

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末慎菲,一起剝皮案震驚了整個濱河市嫁蛇,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌露该,老刑警劉巖睬棚,帶你破解...
    沈念sama閱讀 217,185評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異解幼,居然都是意外死亡抑党,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,652評論 3 393
  • 文/潘曉璐 我一進店門撵摆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來底靠,“玉大人,你說我怎么就攤上這事特铝∈钪校” “怎么了?”我有些...
    開封第一講書人閱讀 163,524評論 0 353
  • 文/不壞的土叔 我叫張陵鲫剿,是天一觀的道長鳄逾。 經(jīng)常有香客問我,道長灵莲,這世上最難降的妖魔是什么雕凹? 我笑而不...
    開封第一講書人閱讀 58,339評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮笆呆,結(jié)果婚禮上请琳,老公的妹妹穿的比我還像新娘。我一直安慰自己赠幕,他們只是感情好俄精,可當我...
    茶點故事閱讀 67,387評論 6 391
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著榕堰,像睡著了一般竖慧。 火紅的嫁衣襯著肌膚如雪嫌套。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,287評論 1 301
  • 那天圾旨,我揣著相機與錄音踱讨,去河邊找鬼。 笑死砍的,一個胖子當著我的面吹牛痹筛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播廓鞠,決...
    沈念sama閱讀 40,130評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼帚稠,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了床佳?” 一聲冷哼從身側(cè)響起滋早,我...
    開封第一講書人閱讀 38,985評論 0 275
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎砌们,沒想到半個月后杆麸,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,420評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡浪感,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,617評論 3 334
  • 正文 我和宋清朗相戀三年昔头,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片篮撑。...
    茶點故事閱讀 39,779評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡减细,死狀恐怖匆瓜,靈堂內(nèi)的尸體忽然破棺而出赢笨,到底是詐尸還是另有隱情,我是刑警寧澤驮吱,帶...
    沈念sama閱讀 35,477評論 5 345
  • 正文 年R本政府宣布茧妒,位于F島的核電站,受9級特大地震影響左冬,放射性物質(zhì)發(fā)生泄漏桐筏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,088評論 3 328
  • 文/蒙蒙 一拇砰、第九天 我趴在偏房一處隱蔽的房頂上張望梅忌。 院中可真熱鬧,春花似錦除破、人聲如沸牧氮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,716評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽踱葛。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間尸诽,已是汗流浹背甥材。 一陣腳步聲響...
    開封第一講書人閱讀 32,857評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留性含,地道東北人洲赵。 一個月前我還...
    沈念sama閱讀 47,876評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像商蕴,于是被迫代替她去往敵國和親板鬓。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,700評論 2 354

推薦閱讀更多精彩內(nèi)容