3.在Java中使用K最近鄰(KNN)分類(lèi)器

案例分析

假設(shè)你有一個(gè)博客耸三,其中包含了很多不錯(cuò)的文章。 你把廣告放在每篇文章的頂部浇揩,希望獲得一些收入仪壮。 過(guò)了一段時(shí)間,從你的報(bào)告胳徽,你看到一些職位產(chǎn)生的收入积锅,有些則沒(méi)有爽彤。 假設(shè)一篇文章是否能產(chǎn)生收益,取決于文章中有多少圖片和文字段落缚陷。

給下面的數(shù)據(jù)集:


數(shù)據(jù)集

我們可以將它們繪制在下圖中适篙。

K近鄰

K-Nearest Neighbors(KNN)算法是如何工作的?

當(dāng)寫(xiě)新文章時(shí)箫爷,我們沒(méi)有來(lái)自報(bào)告的數(shù)據(jù)嚷节。 如果我們想知道新文章是否可以產(chǎn)生收益,我們可以1)計(jì)算新文章與現(xiàn)有文章中每篇文章之間的距離虎锚,2)按照降序排列距離硫痰,3)以k的多數(shù)表決。 這是KNN的基本思想窜护。

現(xiàn)在讓我們來(lái)猜測(cè)一篇新的文章碍论,其中包含13張圖片和1段,可以賺錢(qián)或不賺錢(qián)柄慰。 通過(guò)將圖中的這一點(diǎn)可視化鳍悠,我們可以猜測(cè)它會(huì)獲利。 但是我們會(huì)用Java來(lái)做坐搔。

Java解決

Weka也提供了“IBk”類(lèi)藏研。 IBk實(shí)現(xiàn)kNN。 它使用所有屬性的歸一化距離概行,以便不同比例的屬性對(duì)距離函數(shù)具有相同的影響蠢挡。 如果有距離關(guān)系,它可能會(huì)返回超過(guò)k個(gè)鄰居凳忙。 鄰居被投票形成最后的分類(lèi)业踏。

首先通過(guò)創(chuàng)建一個(gè)txt文件“ads.txt”來(lái)準(zhǔn)備你的數(shù)據(jù):

@relation ads

@attribute pictures numeric
@attribute paragraphs numeric
@attribute profit {Y, N}

@data
10,2,Y
12,3,Y
9,2,Y
0,10,N
1,9,N
3,11,N

Java Code:

import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
 
import weka.classifiers.Classifier;
import weka.classifiers.lazy.IBk;
import weka.core.Instance;
import weka.core.Instances;
 
public class KNN {
    public static BufferedReader readDataFile(String filename) {
        BufferedReader inputReader = null;
 
        try {
            inputReader = new BufferedReader(new FileReader(filename));
        } catch (FileNotFoundException ex) {
            System.err.println("File not found: " + filename);
        }
 
        return inputReader;
    }
 
    public static void main(String[] args) throws Exception {
        BufferedReader datafile = readDataFile("ads.txt");
 
        Instances data = new Instances(datafile);
        data.setClassIndex(data.numAttributes() - 1);
 
        //do not use first and second
        Instance first = data.instance(0);
        Instance second = data.instance(1);
        data.delete(0);
        data.delete(1);
 
        Classifier ibk = new IBk();     
        ibk.buildClassifier(data);
 
        double class1 = ibk.classifyInstance(first);
        double class2 = ibk.classifyInstance(second);
 
        System.out.println("first: " + class1 + "\nsecond: " + class2);
    }
}

輸出:
···
first: 0.0
second: 1.0
···

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市涧卵,隨后出現(xiàn)的幾起案子勤家,更是在濱河造成了極大的恐慌,老刑警劉巖柳恐,帶你破解...
    沈念sama閱讀 219,490評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件伐脖,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡乐设,警方通過(guò)查閱死者的電腦和手機(jī)讼庇,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)近尚,“玉大人蠕啄,你說(shuō)我怎么就攤上這事「甓停” “怎么了歼跟?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,830評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵却嗡,是天一觀(guān)的道長(zhǎng)。 經(jīng)常有香客問(wèn)我嘹承,道長(zhǎng)窗价,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,957評(píng)論 1 295
  • 正文 為了忘掉前任叹卷,我火速辦了婚禮撼港,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘骤竹。我一直安慰自己帝牡,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,974評(píng)論 6 393
  • 文/花漫 我一把揭開(kāi)白布蒙揣。 她就那樣靜靜地躺著靶溜,像睡著了一般。 火紅的嫁衣襯著肌膚如雪懒震。 梳的紋絲不亂的頭發(fā)上罩息,一...
    開(kāi)封第一講書(shū)人閱讀 51,754評(píng)論 1 307
  • 那天,我揣著相機(jī)與錄音个扰,去河邊找鬼瓷炮。 笑死,一個(gè)胖子當(dāng)著我的面吹牛递宅,可吹牛的內(nèi)容都是我干的娘香。 我是一名探鬼主播,決...
    沈念sama閱讀 40,464評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼办龄,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼烘绽!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起俐填,我...
    開(kāi)封第一講書(shū)人閱讀 39,357評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤安接,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后玷禽,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體赫段,經(jīng)...
    沈念sama閱讀 45,847評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,995評(píng)論 3 338
  • 正文 我和宋清朗相戀三年矢赁,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片贬丛。...
    茶點(diǎn)故事閱讀 40,137評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡撩银,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出豺憔,到底是詐尸還是另有隱情额获,我是刑警寧澤够庙,帶...
    沈念sama閱讀 35,819評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站抄邀,受9級(jí)特大地震影響耘眨,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜境肾,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,482評(píng)論 3 331
  • 文/蒙蒙 一剔难、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧奥喻,春花似錦偶宫、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,023評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至冷离,卻和暖如春吵冒,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背西剥。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,149評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工桦锄, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人蔫耽。 一個(gè)月前我還...
    沈念sama閱讀 48,409評(píng)論 3 373
  • 正文 我出身青樓结耀,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親匙铡。 傳聞我的和親對(duì)象是個(gè)殘疾皇子图甜,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,086評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容