文章原創(chuàng),最近更新:2018-07-17
學(xué)習(xí)鏈接:
3.2 Types of Learning -Learning with Different Data Label
學(xué)習(xí)參考鏈接:
1跌宛、臺(tái)灣大學(xué)林軒田機(jī)器學(xué)習(xí)基石課程學(xué)習(xí)筆記3 -- Types of Learning
現(xiàn)在再來(lái)講一下機(jī)器學(xué)習(xí)的變形,從多類別的案例,美國(guó)不同硬幣的辨別出發(fā).之前是根據(jù)收集美國(guó)銅板的大小以及重量都收集好,然后將這些資料提供給機(jī)器學(xué)習(xí).然后機(jī)器會(huì)提供g.一般把這種方法叫做監(jiān)督式學(xué)習(xí).
如果我們拿到的訓(xùn)練樣本D既有輸入特征x,也有輸出yn栈源,那么我們把這種類型的學(xué)習(xí)稱為監(jiān)督式學(xué)習(xí)(Supervised Learning)酌予。監(jiān)督式學(xué)習(xí)可以是二元分類、多元分類或者是回歸晨另,最重要的是知道輸出標(biāo)簽yn.
- 比如這里的案例,知道銅板,并且給予正確的意思是什么?比如重量以及大小對(duì)應(yīng)的銅板意思.這是一個(gè)比較完整的教學(xué).
與監(jiān)督式學(xué)習(xí)相對(duì)立的另一種類型是非監(jiān)督式學(xué)習(xí)(Unsupervised learning)。非監(jiān)督式學(xué)習(xí)是沒(méi)有輸出標(biāo)簽yn的,典型的非監(jiān)督式學(xué)習(xí)包括:聚類(clustering)問(wèn)題家浇,比如對(duì)網(wǎng)頁(yè)上新聞的自動(dòng)分類;密度估計(jì)碴裙,比如交通路況分析钢悲;異常檢測(cè),比如用戶網(wǎng)絡(luò)流量監(jiān)測(cè)舔株。通常情況下莺琳,非監(jiān)督式學(xué)習(xí)更復(fù)雜一些,而且非監(jiān)督的問(wèn)題很多都可以使用監(jiān)督式學(xué)習(xí)的一些算法思想來(lái)實(shí)現(xiàn)载慈。
-
比如不告訴電腦銅板的意思是什么?電腦可不可以學(xué)到東西呢?最終會(huì)看到的是如下的截圖.電腦自己想辦法,將銅板分成分為3堆不同的銅板,具體如下:
以上類似于把銅板丟給小朋友,小朋友自己去分堆.并分提供區(qū)分硬幣的方法.
介于監(jiān)督式和非監(jiān)督式學(xué)習(xí)之間的叫做半監(jiān)督式學(xué)習(xí)(Semi-supervised Learning)惭等。顧名思義,半監(jiān)督式學(xué)習(xí)就是說(shuō)一部分?jǐn)?shù)據(jù)有輸出標(biāo)簽yn办铡,而另一部分?jǐn)?shù)據(jù)沒(méi)有輸出標(biāo)簽yn辞做。在實(shí)際應(yīng)用中,半監(jiān)督式學(xué)習(xí)有時(shí)候是必須的寡具,比如醫(yī)藥公司對(duì)某些藥物進(jìn)行檢測(cè)秤茅,考慮到成本和實(shí)驗(yàn)人群限制等問(wèn)題,只有一部分?jǐn)?shù)據(jù)有輸出標(biāo)簽yn童叠。
主要是應(yīng)用在:
- 比如今天有很多的照片,需要花費(fèi)很多的時(shí)間將照片找出來(lái)有點(diǎn)困難,只能標(biāo)出少部分的照片.很多照片如果很多沒(méi)有標(biāo)記的照片,也許機(jī)器可以自動(dòng)學(xué)習(xí).標(biāo)記的點(diǎn)用彩色的點(diǎn)表示,未標(biāo)記的點(diǎn)用藍(lán)色點(diǎn)表示.
- 比如試藥,費(fèi)用很貴,只能提供部分的藥進(jìn)行試藥.
特點(diǎn)是:要找到標(biāo)記是因?yàn)楹苜F很費(fèi)時(shí)間,這種情況就需要用到半監(jiān)督學(xué)習(xí).需要用到大部分未標(biāo)的資料讓機(jī)器學(xué)習(xí)自動(dòng)學(xué)習(xí).
監(jiān)督式框喳、非監(jiān)督式、半監(jiān)督式學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域三個(gè)主要類型拯钻。除此之外帖努,還有一種非常重要的類型:增強(qiáng)學(xué)習(xí)(Reinforcement Learning)。
增強(qiáng)學(xué)習(xí)中粪般,我們給模型或系統(tǒng)一些輸入拼余,但是給不了我們希望的真實(shí)的輸出y,根據(jù)模型的輸出反饋亩歹,如果反饋結(jié)果良好匙监,更接近真實(shí)輸出凡橱,就給其正向激勵(lì),如果反饋結(jié)果不好亭姥,偏離真實(shí)輸出稼钩,就給其反向激勵(lì)。不斷通過(guò)“反饋-修正”這種形式达罗,一步一步讓模型學(xué)習(xí)的更好坝撑,這就是增強(qiáng)學(xué)習(xí)的核心所在。
增強(qiáng)學(xué)習(xí)可以類比成訓(xùn)練寵物的過(guò)程粮揉,比如我們要訓(xùn)練狗狗坐下巡李,但是狗狗無(wú)法直接聽懂我們的指令“sit down”。在訓(xùn)練過(guò)程中扶认,我們給狗狗示意侨拦,如果它表現(xiàn)得好,我們就給他獎(jiǎng)勵(lì)辐宾,如果它做跟sit down完全無(wú)關(guān)的動(dòng)作狱从,我們就給它小小的懲罰。這樣不斷修正狗狗的動(dòng)作叠纹,最終能讓它按照我們的指令來(lái)行動(dòng)季研。實(shí)際生活中,增強(qiáng)學(xué)習(xí)的例子也很多誉察,比如根據(jù)用戶點(diǎn)擊训貌、選擇而不斷改進(jìn)的廣告系統(tǒng)
應(yīng)用場(chǎng)景:
- 比如廣告系統(tǒng),比如顧客訓(xùn)練廣告系統(tǒng)是怎么做的,輸入是顧客的資料,放的廣告是可能的輸出這就是y,顧客有沒(méi)有點(diǎn)擊這個(gè)廣告.經(jīng)過(guò)這個(gè)過(guò)程就知道好不好.這個(gè)廣告系統(tǒng)就知道什么時(shí)候最適合播放廣告.
- 比如玩牌或者棋類的游戲,比如21點(diǎn),在拿到一些牌的情況下,判斷是否補(bǔ)發(fā)那些牌.
簡(jiǎn)單總結(jié)一下,機(jī)器學(xué)習(xí)按照數(shù)據(jù)輸出標(biāo)簽yn劃分的話冒窍,包括監(jiān)督式學(xué)習(xí)递沪、非監(jiān)督式學(xué)習(xí)、半監(jiān)督式學(xué)習(xí)和增強(qiáng)學(xué)習(xí)等综液。其中款慨,監(jiān)督式學(xué)習(xí)應(yīng)用最為廣泛。
題目練習(xí):
一個(gè)公司想要做樹的辨識(shí)系統(tǒng),收集很多樹的照片,讓公司的員工進(jìn)行標(biāo)記,里面是有樹還是沒(méi)有樹.但是很多其他的照片是沒(méi)有標(biāo)記,這個(gè)演算法到底是解決什么樣的問(wèn)題?
答案是3,半監(jiān)督學(xué)習(xí).