3.在Java中使用K最近鄰（KNN）分類(lèi)器

案例分析

假設(shè)你有一個(gè)博客耸三，其中包含了很多不錯(cuò)的文章。你把廣告放在每篇文章的頂部浇揩，希望獲得一些收入仪壮。過(guò)了一段時(shí)間，從你的報(bào)告胳徽，你看到一些職位產(chǎn)生的收入积锅，有些則沒(méi)有爽彤。假設(shè)一篇文章是否能產(chǎn)生收益，取決于文章中有多少圖片和文字段落缚陷。

給下面的數(shù)據(jù)集：

數(shù)據(jù)集

我們可以將它們繪制在下圖中适篙。

K近鄰

K-Nearest Neighbors（KNN）算法是如何工作的？

當(dāng)寫(xiě)新文章時(shí)箫爷，我們沒(méi)有來(lái)自報(bào)告的數(shù)據(jù)嚷节。如果我們想知道新文章是否可以產(chǎn)生收益，我們可以1）計(jì)算新文章與現(xiàn)有文章中每篇文章之間的距離虎锚，2）按照降序排列距離硫痰，3）以k的多數(shù)表決。這是KNN的基本思想窜护。

現(xiàn)在讓我們來(lái)猜測(cè)一篇新的文章碍论，其中包含13張圖片和1段，可以賺錢(qián)或不賺錢(qián)柄慰。通過(guò)將圖中的這一點(diǎn)可視化鳍悠，我們可以猜測(cè)它會(huì)獲利。但是我們會(huì)用Java來(lái)做坐搔。

Java解決

Weka也提供了“IBk”類(lèi)藏研。 IBk實(shí)現(xiàn)kNN。它使用所有屬性的歸一化距離概行，以便不同比例的屬性對(duì)距離函數(shù)具有相同的影響蠢挡。如果有距離關(guān)系，它可能會(huì)返回超過(guò)k個(gè)鄰居凳忙。鄰居被投票形成最后的分類(lèi)业踏。

首先通過(guò)創(chuàng)建一個(gè)txt文件“ads.txt”來(lái)準(zhǔn)備你的數(shù)據(jù)：

@relation ads

@attribute pictures numeric
@attribute paragraphs numeric
@attribute profit {Y, N}

@data
10,2,Y
12,3,Y
9,2,Y
0,10,N
1,9,N
3,11,N

Java Code:

import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
 
import weka.classifiers.Classifier;
import weka.classifiers.lazy.IBk;
import weka.core.Instance;
import weka.core.Instances;
 
public class KNN {
    public static BufferedReader readDataFile(String filename) {
        BufferedReader inputReader = null;
 
        try {
            inputReader = new BufferedReader(new FileReader(filename));
        } catch (FileNotFoundException ex) {
            System.err.println("File not found: " + filename);
        }
 
        return inputReader;
    }
 
    public static void main(String[] args) throws Exception {
        BufferedReader datafile = readDataFile("ads.txt");
 
        Instances data = new Instances(datafile);
        data.setClassIndex(data.numAttributes() - 1);
 
        //do not use first and second
        Instance first = data.instance(0);
        Instance second = data.instance(1);
        data.delete(0);
        data.delete(1);
 
        Classifier ibk = new IBk();     
        ibk.buildClassifier(data);
 
        double class1 = ibk.classifyInstance(first);
        double class2 = ibk.classifyInstance(second);
 
        System.out.println("first: " + class1 + "\nsecond: " + class2);
    }
}

輸出：
···
first: 0.0
second: 1.0
···

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市涧卵，隨后出現(xiàn)的幾起案子勤家，更是在濱河造成了極大的恐慌，老刑警劉巖柳恐，帶你破解...
沈念sama閱讀 219,490評(píng)論 6贊 508
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件伐脖，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡乐设，警方通過(guò)查閱死者的電腦和手機(jī)讼庇，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,581評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)近尚，“玉大人蠕啄，你說(shuō)我怎么就攤上這事「甓停” “怎么了歼跟？”我有些...
開(kāi)封第一講書(shū)人閱讀 165,830評(píng)論 0贊 356
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵却嗡，是天一觀(guān)的道長(zhǎng)。經(jīng)常有香客問(wèn)我嘹承，道長(zhǎng)窗价，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,957評(píng)論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任叹卷，我火速辦了婚禮撼港，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘骤竹。我一直安慰自己帝牡，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,974評(píng)論 6贊 393
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布蒙揣。她就那樣靜靜地躺著靶溜，像睡著了一般。火紅的嫁衣襯著肌膚如雪懒震。梳的紋絲不亂的頭發(fā)上罩息，一...
開(kāi)封第一講書(shū)人閱讀 51,754評(píng)論 1贊 307
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音个扰，去河邊找鬼瓷炮。笑死，一個(gè)胖子當(dāng)著我的面吹牛递宅，可吹牛的內(nèi)容都是我干的娘香。我是一名探鬼主播，決...
沈念sama閱讀 40,464評(píng)論 3贊 420
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼办龄，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼烘绽！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起俐填，我...
開(kāi)封第一講書(shū)人閱讀 39,357評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤安接，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后玷禽，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體赫段，經(jīng)...
沈念sama閱讀 45,847評(píng)論 1贊 317
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,995評(píng)論 3贊 338
?白月光啟示錄
正文我和宋清朗相戀三年矢赁，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片贬丛。...
茶點(diǎn)故事閱讀 40,137評(píng)論 1贊 351
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡撩银，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出豺憔，到底是詐尸還是另有隱情额获，我是刑警寧澤够庙，帶...
沈念sama閱讀 35,819評(píng)論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站抄邀，受9級(jí)特大地震影響耘眨，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜境肾，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,482評(píng)論 3贊 331
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一剔难、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧奥喻，春花似錦偶宫、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 32,023評(píng)論 0贊 22
一樁弒父案纯趋，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至冷离，卻和暖如春吵冒，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背西剥。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,149評(píng)論 1贊 272
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工桦锄，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人蔫耽。一個(gè)月前我還...
沈念sama閱讀 48,409評(píng)論 3贊 373
代替公主和親
正文我出身青樓结耀，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親匙铡。傳聞我的和親對(duì)象是個(gè)殘疾皇子图甜，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 45,086評(píng)論 2贊 355

3.在Java中使用K最近鄰（KNN）分類(lèi)器

案例分析

K-Nearest Neighbors（KNN）算法是如何工作的？

Java解決

推薦閱讀更多精彩內(nèi)容