上篇內(nèi)容介紹關(guān)于機(jī)器學(xué)習(xí)一些基礎(chǔ)概念的理解,今天深入的介紹機(jī)器學(xué)習(xí)的各種方式蚜厉,以及在產(chǎn)品中的有哪些應(yīng)用敲长。
機(jī)器學(xué)習(xí)都有哪些學(xué)習(xí)方式梨与?
涉及到機(jī)器學(xué)習(xí)相關(guān)知識:
- 監(jiān)督學(xué)習(xí):需要“標(biāo)簽”當(dāng)老師凰锡,明確要預(yù)測什么未舟。
- 無監(jiān)督學(xué)習(xí):不告訴機(jī)器正確答案圈暗,讓機(jī)器自己學(xué)習(xí),給出結(jié)果裕膀。
- 半監(jiān)督學(xué)習(xí):訓(xùn)練的數(shù)據(jù)员串,只有一小部分是標(biāo)記過的,大部分是沒有標(biāo)記昼扛。
- 強(qiáng)化學(xué)習(xí):通過反饋寸齐,邊實(shí)踐邊學(xué)習(xí)。
- 遷移學(xué)習(xí):在某個垂直領(lǐng)域訓(xùn)練完成后野揪,移致去其他相關(guān)領(lǐng)域調(diào)優(yōu)發(fā)揮作用访忿。
監(jiān)督學(xué)習(xí)
什么是監(jiān)督學(xué)習(xí):
- 概念:監(jiān)督學(xué)習(xí)就是通過樣例給定輸入與輸出瞧栗,讓程序?qū)W會一些通用的規(guī)則斯稳,這樣對于需要預(yù)測的數(shù)據(jù),得到輸出迹恐。
- 詮釋:有一個明確預(yù)測的目標(biāo)挣惰,比如:預(yù)估房價(jià),給予機(jī)器大量的有標(biāo)簽的數(shù)據(jù)殴边,以及最終的銷售價(jià)憎茂,來訓(xùn)練這個模型。
監(jiān)督學(xué)習(xí)主要解決的是兩類問題:
-
回歸問題:
- 概念:預(yù)測結(jié)果是連續(xù)的锤岸,意味著我們嘗試將輸入變量映射到一些連續(xù)函數(shù)竖幔。
- 舉例:如預(yù)測房價(jià)的例子,通過大量輸入輸出數(shù)據(jù)是偷,以及各種房屋類型拳氢,環(huán)境等標(biāo)簽,訓(xùn)練模型后蛋铆,輸入新的數(shù)據(jù)馋评,既可預(yù)測房價(jià)。
-
分類問題:
- 概念:預(yù)測結(jié)果是離散的刺啦,意味著我們嘗試將輸入變量映射到離散類別留特。
- 舉例:如芒果的例子,同樣通過大量輸入輸出數(shù)據(jù)玛瘸,包括芒果蜕青,顏色,大小糊渊,形狀市咆,以及甜度,成熟度等標(biāo)簽再来,當(dāng)輸入新的數(shù)據(jù)蒙兰,機(jī)器計(jì)算出屬于這個芒果是在吃磷瘤,還是在不好吃的分類里。
監(jiān)督學(xué)習(xí)主要涉及到的算法模型如下:
- 線性回歸模型(Linear Regression)
- K-近鄰算法(k-Nearest Neighbors搜变,KNN)
- 決策樹(Decision Trees)
- 樸素貝葉斯(Naive Bayesian)
- 邏輯回歸(Logistic Regression)
個人建議產(chǎn)品經(jīng)理對于算法重視采缚,初期知道解決的是什么問題即可,不要從學(xué)習(xí)的視角去深入挠他,而是實(shí)際遇到問題扳抽,遇到問題時候再研究。
無監(jiān)督學(xué)習(xí)
什么是無監(jiān)督學(xué)習(xí):
- 詮釋:無監(jiān)督學(xué)習(xí)就是不給數(shù)據(jù)提供標(biāo)簽殖侵,由程序自動對數(shù)據(jù)進(jìn)行聚類贸呢、關(guān)聯(lián)、降維等工作拢军。
- 詮釋:我們擁有大量的數(shù)據(jù)楞陷,但是不知道答案,需要用無監(jiān)督學(xué)習(xí)的方法茉唉,讓它們根據(jù)某些特征自動分成若干組固蛾,從而找到數(shù)據(jù)中存在的價(jià)值。
無監(jiān)督學(xué)習(xí)主要解決的三類問題:
-
關(guān)聯(lián)
- 概念:為了發(fā)現(xiàn)各種現(xiàn)象同時出現(xiàn)的概率度陆。
- 舉例:經(jīng)典例子艾凯,男人買啤酒和買尿布的關(guān)聯(lián)性非常高,超市把啤酒和尿布放在一起懂傀,從而提高業(yè)績趾诗。
-
聚類
- 概念:把樣本分堆,使同一堆中的樣本之間很相似蹬蚁,而不同堆之間的樣本就有些差別恃泪。
- 舉例:Google新聞,每天會搜集大量的新聞缚忧,然后把它們?nèi)烤垲愇虮茫蜁詣臃殖蓭资畟€不同的組(比如娛樂,科技闪水,政治......)糕非,每個組內(nèi)新聞都具有相似的內(nèi)容結(jié)構(gòu)。
-
降維
- 概念:降維意味著減少數(shù)據(jù)集中變量的個數(shù)球榆,但是仍然保留重要的信息朽肥。主要作用是壓縮數(shù)據(jù)與提升機(jī)器學(xué)習(xí)其他算法的效率。
- 舉例:房價(jià)包含房子的長持钉、寬衡招、面積與房間數(shù)量四個特征,也就是維度為4維的數(shù)據(jù)每强。而面積=長 × 寬始腾,通過降維算法我們就可以去除冗余信息州刽,即從4維的數(shù)據(jù)壓縮到2維
無監(jiān)督學(xué)習(xí)主要涉及到的算法模型如下:
- K 均值算法(K-means)
- 自編碼(Autoencoding)
- 主成分分析(Principal components analysis)
- 隨機(jī)森林(Random forests)
同理,解決實(shí)際問題中浪箭,再深入到算法里提升自己的認(rèn)知穗椅。
半監(jiān)督學(xué)習(xí)
什么是半監(jiān)督學(xué)習(xí):
- 概念:使用大量的未標(biāo)記數(shù)據(jù),以及同時使用標(biāo)記數(shù)據(jù)奶栖,來進(jìn)行模式識別工作匹表。
- 詮釋:大概意思就是,監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)相結(jié)合的一種學(xué)習(xí)方法宣鄙,介于兩者之間袍镀。
半監(jiān)督學(xué)習(xí)解決問題:
- 相比監(jiān)督學(xué)習(xí):節(jié)約人力成本,提高投入產(chǎn)出比冻晤。
- 相比無監(jiān)督學(xué)習(xí):可以得到分配更高精度的模型苇羡。
具體適用場景的舉例:
- 例如:視頻網(wǎng)站上有幾百萬的視頻,但其中只有幾十萬的視頻有標(biāo)簽明也,如果把剩下幾百萬視頻都打上標(biāo)簽宣虾,工作量和成本是巨大的惯裕,而用無監(jiān)督的方法温数,在很多情況下精度會很低,所以使用半監(jiān)督的方法蜻势,可以在節(jié)省人力的情況下撑刺,得到分類更高精度的模型。
- 例如:垃圾信息過濾握玛,一般的方法是監(jiān)督够傍,需要大量的語料標(biāo)注,告知系統(tǒng)哪些可能是垃圾信息挠铲。但用戶產(chǎn)會生了大量的信息冕屯,且垃圾信息的發(fā)布者也在調(diào)整策略,無法進(jìn)行實(shí)時標(biāo)注拂苹,這里可以用半監(jiān)督的方法安聘,根據(jù)垃圾信息發(fā)布者的特殊行為,發(fā)布內(nèi)容等找到相似性瓢棒,進(jìn)行過濾浴韭。
強(qiáng)化學(xué)習(xí)
什么是強(qiáng)化學(xué)習(xí):
- 概念:強(qiáng)化學(xué)習(xí)就是智能系統(tǒng)從環(huán)境到行為映射的學(xué)習(xí),以使獎勵信號(強(qiáng)化信號)函數(shù)值最大脯宿。如果Agent的某個行為策略導(dǎo)致環(huán)境正的獎賞(強(qiáng)化信號)念颈,那么Agent以后產(chǎn)生這個行為策略的趨勢便會加強(qiáng)。
- 詮釋:針對沒有標(biāo)注數(shù)據(jù)集的情況而言连霉,通過反饋來區(qū)分是否越來越接近目標(biāo)榴芳。比如常見一個猜價(jià)格的游戲嗡靡,你來猜這個東西值多少錢,別人告訴你猜的價(jià)格是高了還是低了窟感。
- 例如:阿爾法狗叽躯,自己跟自己下圍棋,通過一盤盤的勝負(fù)肌括,自我學(xué)習(xí)点骑、自我修煉、自我改正谍夭,然后一個一個迭代黑滴,自己跟自己下了1000萬盤之后,完全就是一個新的狗狗紧索。
強(qiáng)化學(xué)習(xí)和監(jiān)督學(xué)習(xí)的區(qū)別:
-
監(jiān)督學(xué)習(xí)總的來說是一個開環(huán)的學(xué)習(xí)袁辈。
- 通常,監(jiān)督學(xué)習(xí)任務(wù)會從環(huán)境中收集一批數(shù)據(jù)珠漂;
- 接著我們用監(jiān)督學(xué)習(xí)算法從數(shù)據(jù)中產(chǎn)生模型晚缩;
- 最后就可以用這個模型來做預(yù)測了。
-
但是對于強(qiáng)化學(xué)習(xí)來說媳危,它面對的是一個閉環(huán)的學(xué)習(xí)荞彼。
- 首先,也是從環(huán)境中產(chǎn)生數(shù)據(jù)待笑;
- 用強(qiáng)化學(xué)習(xí)的算法從數(shù)據(jù)中產(chǎn)生模型鸣皂;
- 還要把模型放回到環(huán)境中運(yùn)行,接著又會產(chǎn)生新的數(shù)據(jù)出來暮蹂,再重復(fù)以上步驟寞缝。
強(qiáng)化學(xué)習(xí)的應(yīng)用:
- 例如:訓(xùn)練機(jī)器臂,把一個指的位置的物體仰泻,拿到另外一個指定的位置上荆陆,這里你不告訴它怎么做,讓他通過一遍遍的訓(xùn)練集侯,找到最佳的移動物體路徑被啼。
- 例如:個性化推薦,當(dāng)推薦你某個分類內(nèi)容時候浅悉,你會點(diǎn)擊或查看趟据,它就會根據(jù)你的行為,推薦給你更多該分類的內(nèi)容术健。
- 例如:無人機(jī)操作汹碱,指定你的無人機(jī)進(jìn)行某種動作飛行,通過強(qiáng)化學(xué)習(xí)來控制高度荞估,速度咳促,姿態(tài)等等稚新,根據(jù)獎勵讓它自己學(xué)習(xí)策略,來達(dá)到目的
遷移學(xué)習(xí)
什么是遷移學(xué)習(xí):
- 概念:一般就是指要將從源領(lǐng)域?qū)W習(xí)到的東西應(yīng)用到目標(biāo)領(lǐng)域上去跪腹。
- 詮釋:比如你會騎自行車褂删,你會控制車把,剎車冲茸,控訴屯阀,躲避,踩踏轴术,平衡感等等难衰,然后讓你騎摩托車時候,你也可以輕易上手逗栽,逐漸適應(yīng)速度和動力上的特殊性盖袭。
遷移學(xué)習(xí)應(yīng)用:
- 模擬中學(xué)習(xí):不管是無人車,還是機(jī)械臂彼宠,在現(xiàn)實(shí)中學(xué)習(xí)耗時且昂貴鳄虱。通過模擬的方法,在虛擬中完成部分的訓(xùn)練凭峡,遷移到現(xiàn)實(shí)中拙已,當(dāng)然這種方法存在很多問題,畢竟虛擬世界無法做到跟現(xiàn)實(shí)一模一樣想罕,比如物理引擎悠栓,但是作為初始訓(xùn)練是可行的霉涨。
- 適應(yīng)新領(lǐng)域:在線推薦系統(tǒng)中利用遷移學(xué)習(xí)按价,例如影像資料領(lǐng)域做好一個推薦系統(tǒng),然后應(yīng)用在稀疏的笙瑟、新的垂直領(lǐng)域書籍資料里楼镐。
- 跨語言傳播知識:從一種語言學(xué)習(xí)然后將所得知識應(yīng)用于另一種語言,是遷移學(xué)習(xí)的另一個重要應(yīng)用往枷。比如英語訓(xùn)練之后框产,遷移到印度本土語言上。
以上就是本人對于機(jī)器學(xué)習(xí)中各種學(xué)習(xí)方式理解错洁,而其中的「深度學(xué)習(xí)」部分會單獨(dú)談?wù)勛约豪斫狻?/p>
AI PM認(rèn)知系列的相關(guān)閱讀:
第一篇:從0開始搭建產(chǎn)品經(jīng)理的AI認(rèn)知體系
第二篇:產(chǎn)品經(jīng)理的AI知識框架:計(jì)算機(jī)視覺
第三篇:產(chǎn)品經(jīng)理的AI知識框架:語音識別與合成
第四篇:產(chǎn)品經(jīng)理的AI知識框架:機(jī)器學(xué)習(xí)1基礎(chǔ)篇
作者:蘭楓秉宿,前騰訊游戲,新浪微博PM屯碴,Elex產(chǎn)品總監(jiān)描睦,連續(xù)創(chuàng)業(yè)者。