關(guān)于online learning的不同說(shuō)法:
- Online learning是機(jī)器學(xué)習(xí)中的一種方法弟头。其目的是正確預(yù)測(cè)數(shù)據(jù)的類別,并且在每次預(yù)測(cè)后,該結(jié)果用來(lái)更新修正預(yù)測(cè)模型,用于對(duì)以后數(shù)據(jù)進(jìn)行更好的預(yù)測(cè)。而不同于batch learning 裁僧,batch learning 生成的最好預(yù)測(cè)僅基于一次確定的數(shù)據(jù)訓(xùn)練集。
一般的慕购,一種Online learning算法對(duì)于一個(gè)序列進(jìn)行一系列處理可以分為三步:
第一步聊疲,算法獲得一個(gè)訓(xùn)練實(shí)例;
第二步沪悲,算法預(yù)測(cè)訓(xùn)練實(shí)例的類別获洲;
第三步,算法獲得正確類別可训,并根據(jù)預(yù)測(cè)類別與正確類別更新模型假設(shè)昌妹。
Online learning 很好的應(yīng)用在訓(xùn)練整個(gè)數(shù)據(jù)集在計(jì)算上不可行的情況,和一些要求算法動(dòng)態(tài)適應(yīng)型模式的情況握截。
對(duì)應(yīng)的online learning 有兩種通用的模型:1.statistical learning 模型和2.adversarial 模型飞崖。
- statisticallearning 模型:數(shù)據(jù)樣本是獨(dú)立同分布的隨機(jī)變量且不隨時(shí)間變化,算法只是對(duì)數(shù)據(jù)的有限訪問(wèn)谨胞,即不是對(duì)整個(gè)數(shù)據(jù)集的計(jì)算固歪。(如隨機(jī)梯度下降,感知器)
- adversarial模型:我們把問(wèn)題看作是兩個(gè)玩家之間的游戲(學(xué)習(xí)者和數(shù)據(jù)生成器)胯努,在這個(gè)模型中對(duì)手(數(shù)據(jù)生成器)能動(dòng)態(tài)的適應(yīng)該算法輸出產(chǎn)生而產(chǎn)生變化牢裳,例如在垃圾郵件過(guò)濾中,垃圾郵件的產(chǎn)生者能基于過(guò)濾器的表現(xiàn)來(lái)生成新的垃圾郵件叶沛。