本文來自之前在Udacity上自學(xué)機器學(xué)習(xí)的系列筆記猜拾。這是第4篇即舌,介紹了什么是監(jiān)督學(xué)習(xí)。
監(jiān)督學(xué)習(xí)(Supervised Learning)
監(jiān)督學(xué)習(xí)是機器學(xué)習(xí)的一種分類挎袜,“監(jiān)督”是什么意思呢顽聂?它表示在有不同情況下的數(shù)據(jù),都有對應(yīng)的正確的標(biāo)簽來表示什么情況對應(yīng)什么反應(yīng)盯仪。比如說無人駕駛的例子紊搪,通過收集在不同路況(數(shù)據(jù))下人類駕駛員所執(zhí)行的駕駛行為(標(biāo)簽),然后將數(shù)據(jù)收集起來后訓(xùn)練程序全景,讓程序?qū)W習(xí)如何駕駛耀石。從而,程序?qū)W會了在不同路況下自動地執(zhí)行的相應(yīng)的動作蚪燕,從而實現(xiàn)無人駕駛的目的娶牌。
下面再舉四個例子:
- 通過多張分類的圖片集奔浅,識別某張圖片是否存在某個人馆纳;
- 分析信用卡交易數(shù)據(jù),并識別出欺詐交易汹桦;
- 根據(jù)某人的常聽的歌曲以及歌曲的一些屬性鲁驶,推薦某首該人可能喜歡的歌曲;
- 根據(jù)線上學(xué)習(xí)平臺的學(xué)生學(xué)習(xí)特點舞骆,將學(xué)生分類钥弯。
其中,例子1和3屬于監(jiān)督學(xué)習(xí)督禽。例子2因為我們沒有定義所謂的欺詐交易是怎么樣的脆霎,也就是說,沒有給給定的交易標(biāo)簽為欺詐或非欺詐狈惫,所以不屬于監(jiān)督學(xué)習(xí)睛蛛;而例子4屬于非監(jiān)督學(xué)習(xí)的分類,我們不知道學(xué)生有哪些既定的標(biāo)簽分類胧谈。
接著上面的例子3忆肾,常聽的歌曲中有一些屬性Feature,比如歌曲的旋律菱肖、節(jié)奏客冈、曲風(fēng)、歌手性別等稳强,而標(biāo)簽Label則是這個人喜歡的和不喜歡的歌曲场仲。
綜上和悦,監(jiān)督學(xué)習(xí)就是獲取輸入和輸出的例子,然后給定一個新的輸入渠缕,預(yù)測輸出摹闽。輸出的數(shù)據(jù)有兩種類型,連續(xù)的和離散的褐健,前者是回歸模型問題付鹿,后者是分類模型問題。輸出如果是連續(xù)的蚜迅,隱含了輸出是有序的這一特性舵匾,比如說像年齡、收入這些數(shù)據(jù)谁不,從數(shù)學(xué)上的意義坐梯,他們不是純粹地連續(xù),因為沒有人的年齡是18.5歲刹帕,或者收入精確到小數(shù)點后5位吵血。但它們是有序的輸出。