從0開始搭建產(chǎn)品經(jīng)理AI知識框架：機(jī)器學(xué)習(xí)2方法篇

上篇內(nèi)容介紹關(guān)于機(jī)器學(xué)習(xí)一些基礎(chǔ)概念的理解，今天深入的介紹機(jī)器學(xué)習(xí)的各種方式蚜厉，以及在產(chǎn)品中的有哪些應(yīng)用敲长。

機(jī)器學(xué)習(xí)都有哪些學(xué)習(xí)方式梨与？

涉及到機(jī)器學(xué)習(xí)相關(guān)知識：

監(jiān)督學(xué)習(xí)：需要“標(biāo)簽”當(dāng)老師凰锡，明確要預(yù)測什么未舟。
無監(jiān)督學(xué)習(xí)：不告訴機(jī)器正確答案圈暗，讓機(jī)器自己學(xué)習(xí)，給出結(jié)果裕膀。
半監(jiān)督學(xué)習(xí)：訓(xùn)練的數(shù)據(jù)员串，只有一小部分是標(biāo)記過的，大部分是沒有標(biāo)記昼扛。
強(qiáng)化學(xué)習(xí)：通過反饋寸齐，邊實(shí)踐邊學(xué)習(xí)。
遷移學(xué)習(xí)：在某個垂直領(lǐng)域訓(xùn)練完成后野揪，移致去其他相關(guān)領(lǐng)域調(diào)優(yōu)發(fā)揮作用访忿。

監(jiān)督學(xué)習(xí)

什么是監(jiān)督學(xué)習(xí)：

概念：監(jiān)督學(xué)習(xí)就是通過樣例給定輸入與輸出瞧栗，讓程序?qū)W會一些通用的規(guī)則斯稳，這樣對于需要預(yù)測的數(shù)據(jù)，得到輸出迹恐。
詮釋：有一個明確預(yù)測的目標(biāo)挣惰，比如：預(yù)估房價(jià)，給予機(jī)器大量的有標(biāo)簽的數(shù)據(jù)殴边，以及最終的銷售價(jià)憎茂，來訓(xùn)練這個模型。

監(jiān)督學(xué)習(xí)主要解決的是兩類問題：

回歸問題：
- 概念：預(yù)測結(jié)果是連續(xù)的锤岸，意味著我們嘗試將輸入變量映射到一些連續(xù)函數(shù)竖幔。
- 舉例：如預(yù)測房價(jià)的例子，通過大量輸入輸出數(shù)據(jù)是偷，以及各種房屋類型拳氢，環(huán)境等標(biāo)簽，訓(xùn)練模型后蛋铆，輸入新的數(shù)據(jù)馋评，既可預(yù)測房價(jià)。
分類問題：
- 概念：預(yù)測結(jié)果是離散的刺啦，意味著我們嘗試將輸入變量映射到離散類別留特。
- 舉例：如芒果的例子，同樣通過大量輸入輸出數(shù)據(jù)玛瘸，包括芒果蜕青，顏色，大小糊渊，形狀市咆，以及甜度，成熟度等標(biāo)簽再来，當(dāng)輸入新的數(shù)據(jù)蒙兰，機(jī)器計(jì)算出屬于這個芒果是在吃磷瘤，還是在不好吃的分類里。

監(jiān)督學(xué)習(xí)主要涉及到的算法模型如下：

線性回歸模型（Linear Regression）
K-近鄰算法（k-Nearest Neighbors搜变，KNN）
決策樹（Decision Trees）
樸素貝葉斯（Naive Bayesian）
邏輯回歸（Logistic Regression）

個人建議產(chǎn)品經(jīng)理對于算法重視采缚，初期知道解決的是什么問題即可，不要從學(xué)習(xí)的視角去深入挠他，而是實(shí)際遇到問題扳抽，遇到問題時候再研究。

無監(jiān)督學(xué)習(xí)

什么是無監(jiān)督學(xué)習(xí)：

詮釋：無監(jiān)督學(xué)習(xí)就是不給數(shù)據(jù)提供標(biāo)簽殖侵，由程序自動對數(shù)據(jù)進(jìn)行聚類贸呢、關(guān)聯(lián)、降維等工作拢军。
詮釋：我們擁有大量的數(shù)據(jù)楞陷，但是不知道答案，需要用無監(jiān)督學(xué)習(xí)的方法茉唉，讓它們根據(jù)某些特征自動分成若干組固蛾，從而找到數(shù)據(jù)中存在的價(jià)值。

無監(jiān)督學(xué)習(xí)主要解決的三類問題：

關(guān)聯(lián)
- 概念：為了發(fā)現(xiàn)各種現(xiàn)象同時出現(xiàn)的概率度陆。
- 舉例：經(jīng)典例子艾凯，男人買啤酒和買尿布的關(guān)聯(lián)性非常高，超市把啤酒和尿布放在一起懂傀，從而提高業(yè)績趾诗。
聚類
- 概念：把樣本分堆，使同一堆中的樣本之間很相似蹬蚁，而不同堆之間的樣本就有些差別恃泪。
- 舉例：Google新聞，每天會搜集大量的新聞缚忧，然后把它們?nèi)烤垲愇虮茫蜁詣臃殖蓭资畟€不同的組（比如娛樂，科技闪水，政治......）糕非，每個組內(nèi)新聞都具有相似的內(nèi)容結(jié)構(gòu)。
降維
- 概念：降維意味著減少數(shù)據(jù)集中變量的個數(shù)球榆，但是仍然保留重要的信息朽肥。主要作用是壓縮數(shù)據(jù)與提升機(jī)器學(xué)習(xí)其他算法的效率。
- 舉例：房價(jià)包含房子的長持钉、寬衡招、面積與房間數(shù)量四個特征，也就是維度為4維的數(shù)據(jù)每强。而面積=長 × 寬始腾，通過降維算法我們就可以去除冗余信息州刽，即從4維的數(shù)據(jù)壓縮到2維

無監(jiān)督學(xué)習(xí)主要涉及到的算法模型如下：

K 均值算法（K-means）
自編碼（Autoencoding）
主成分分析（Principal components analysis）
隨機(jī)森林（Random forests）

同理，解決實(shí)際問題中浪箭，再深入到算法里提升自己的認(rèn)知穗椅。

半監(jiān)督學(xué)習(xí)

什么是半監(jiān)督學(xué)習(xí)：

概念：使用大量的未標(biāo)記數(shù)據(jù)，以及同時使用標(biāo)記數(shù)據(jù)奶栖，來進(jìn)行模式識別工作匹表。
詮釋：大概意思就是，監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)相結(jié)合的一種學(xué)習(xí)方法宣鄙，介于兩者之間袍镀。

半監(jiān)督學(xué)習(xí)解決問題：

相比監(jiān)督學(xué)習(xí)：節(jié)約人力成本，提高投入產(chǎn)出比冻晤。
相比無監(jiān)督學(xué)習(xí)：可以得到分配更高精度的模型苇羡。

具體適用場景的舉例：

例如：視頻網(wǎng)站上有幾百萬的視頻，但其中只有幾十萬的視頻有標(biāo)簽明也，如果把剩下幾百萬視頻都打上標(biāo)簽宣虾，工作量和成本是巨大的惯裕，而用無監(jiān)督的方法温数，在很多情況下精度會很低，所以使用半監(jiān)督的方法蜻势，可以在節(jié)省人力的情況下撑刺，得到分類更高精度的模型。
例如：垃圾信息過濾握玛，一般的方法是監(jiān)督够傍，需要大量的語料標(biāo)注，告知系統(tǒng)哪些可能是垃圾信息挠铲。但用戶產(chǎn)會生了大量的信息冕屯，且垃圾信息的發(fā)布者也在調(diào)整策略，無法進(jìn)行實(shí)時標(biāo)注拂苹，這里可以用半監(jiān)督的方法安聘，根據(jù)垃圾信息發(fā)布者的特殊行為，發(fā)布內(nèi)容等找到相似性瓢棒，進(jìn)行過濾浴韭。

強(qiáng)化學(xué)習(xí)

什么是強(qiáng)化學(xué)習(xí)：

概念：強(qiáng)化學(xué)習(xí)就是智能系統(tǒng)從環(huán)境到行為映射的學(xué)習(xí)，以使獎勵信號(強(qiáng)化信號)函數(shù)值最大脯宿。如果Agent的某個行為策略導(dǎo)致環(huán)境正的獎賞(強(qiáng)化信號)念颈，那么Agent以后產(chǎn)生這個行為策略的趨勢便會加強(qiáng)。
詮釋：針對沒有標(biāo)注數(shù)據(jù)集的情況而言连霉，通過反饋來區(qū)分是否越來越接近目標(biāo)榴芳。比如常見一個猜價(jià)格的游戲嗡靡，你來猜這個東西值多少錢，別人告訴你猜的價(jià)格是高了還是低了窟感。
例如：阿爾法狗叽躯，自己跟自己下圍棋，通過一盤盤的勝負(fù)肌括，自我學(xué)習(xí)点骑、自我修煉、自我改正谍夭，然后一個一個迭代黑滴，自己跟自己下了1000萬盤之后，完全就是一個新的狗狗紧索。

強(qiáng)化學(xué)習(xí)和監(jiān)督學(xué)習(xí)的區(qū)別：

監(jiān)督學(xué)習(xí)總的來說是一個開環(huán)的學(xué)習(xí)袁辈。
- 通常，監(jiān)督學(xué)習(xí)任務(wù)會從環(huán)境中收集一批數(shù)據(jù)珠漂；
- 接著我們用監(jiān)督學(xué)習(xí)算法從數(shù)據(jù)中產(chǎn)生模型晚缩；
- 最后就可以用這個模型來做預(yù)測了。
但是對于強(qiáng)化學(xué)習(xí)來說媳危，它面對的是一個閉環(huán)的學(xué)習(xí)荞彼。
- 首先，也是從環(huán)境中產(chǎn)生數(shù)據(jù)待笑；
- 用強(qiáng)化學(xué)習(xí)的算法從數(shù)據(jù)中產(chǎn)生模型鸣皂；
- 還要把模型放回到環(huán)境中運(yùn)行，接著又會產(chǎn)生新的數(shù)據(jù)出來暮蹂，再重復(fù)以上步驟寞缝。

強(qiáng)化學(xué)習(xí)的應(yīng)用：

例如：訓(xùn)練機(jī)器臂，把一個指的位置的物體仰泻，拿到另外一個指定的位置上荆陆，這里你不告訴它怎么做，讓他通過一遍遍的訓(xùn)練集侯，找到最佳的移動物體路徑被啼。
例如：個性化推薦，當(dāng)推薦你某個分類內(nèi)容時候浅悉，你會點(diǎn)擊或查看趟据，它就會根據(jù)你的行為，推薦給你更多該分類的內(nèi)容术健。
例如：無人機(jī)操作汹碱，指定你的無人機(jī)進(jìn)行某種動作飛行，通過強(qiáng)化學(xué)習(xí)來控制高度荞估，速度咳促，姿態(tài)等等稚新，根據(jù)獎勵讓它自己學(xué)習(xí)策略，來達(dá)到目的

遷移學(xué)習(xí)

什么是遷移學(xué)習(xí)：

概念：一般就是指要將從源領(lǐng)域?qū)W習(xí)到的東西應(yīng)用到目標(biāo)領(lǐng)域上去跪腹。
詮釋：比如你會騎自行車褂删，你會控制車把，剎車冲茸，控訴屯阀，躲避，踩踏轴术，平衡感等等难衰，然后讓你騎摩托車時候，你也可以輕易上手逗栽，逐漸適應(yīng)速度和動力上的特殊性盖袭。

遷移學(xué)習(xí)應(yīng)用：

模擬中學(xué)習(xí)：不管是無人車，還是機(jī)械臂彼宠，在現(xiàn)實(shí)中學(xué)習(xí)耗時且昂貴鳄虱。通過模擬的方法，在虛擬中完成部分的訓(xùn)練凭峡，遷移到現(xiàn)實(shí)中拙已，當(dāng)然這種方法存在很多問題，畢竟虛擬世界無法做到跟現(xiàn)實(shí)一模一樣想罕，比如物理引擎悠栓，但是作為初始訓(xùn)練是可行的霉涨。
適應(yīng)新領(lǐng)域：在線推薦系統(tǒng)中利用遷移學(xué)習(xí)按价，例如影像資料領(lǐng)域做好一個推薦系統(tǒng)，然后應(yīng)用在稀疏的笙瑟、新的垂直領(lǐng)域書籍資料里楼镐。
跨語言傳播知識：從一種語言學(xué)習(xí)然后將所得知識應(yīng)用于另一種語言，是遷移學(xué)習(xí)的另一個重要應(yīng)用往枷。比如英語訓(xùn)練之后框产，遷移到印度本土語言上。

以上就是本人對于機(jī)器學(xué)習(xí)中各種學(xué)習(xí)方式理解错洁，而其中的「深度學(xué)習(xí)」部分會單獨(dú)談?wù)勛约豪斫狻?/p>

作者：蘭楓秉宿，前騰訊游戲，新浪微博PM屯碴，Elex產(chǎn)品總監(jiān)描睦，連續(xù)創(chuàng)業(yè)者。

最后編輯于：2017.12.11 07:13:25

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末导而，一起剝皮案震驚了整個濱河市忱叭，隨后出現(xiàn)的幾起案子隔崎，更是在濱河造成了極大的恐慌，老刑警劉巖韵丑，帶你破解...
沈念sama閱讀 206,126評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件爵卒，死亡現(xiàn)場離奇詭異，居然都是意外死亡撵彻，警方通過查閱死者的電腦和手機(jī)钓株，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,254評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來陌僵，“玉大人享幽，你說我怎么就攤上這事∈捌” “怎么了值桩？”我有些...
開封第一講書人閱讀 152,445評論 0贊 341
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長豪椿。經(jīng)常有香客問我奔坟，道長，這世上最難降的妖魔是什么搭盾？我笑而不...
開封第一講書人閱讀 55,185評論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任咳秉，我火速辦了婚禮，結(jié)果婚禮上鸯隅，老公的妹妹穿的比我還像新娘澜建。我一直安慰自己，他們只是感情好蝌以，可當(dāng)我...
茶點(diǎn)故事閱讀 64,178評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布炕舵。她就那樣靜靜地躺著，像睡著了一般跟畅。火紅的嫁衣襯著肌膚如雪咽筋。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 48,970評論 1贊 284
城市分裂傳說
那天徊件，我揣著相機(jī)與錄音奸攻，去河邊找鬼。笑死虱痕，一個胖子當(dāng)著我的面吹牛睹耐，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播部翘，決...
沈念sama閱讀 38,276評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼硝训，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起捎迫，我...
開封第一講書人閱讀 36,927評論 0贊 259
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤晃酒，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后窄绒，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體贝次，經(jīng)...
沈念sama閱讀 43,400評論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,883評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年彰导，在試婚紗的時候發(fā)現(xiàn)自己被綠了蛔翅。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 37,997評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡位谋，死狀恐怖山析，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情掏父，我是刑警寧澤笋轨，帶...
沈念sama閱讀 33,646評論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站赊淑，受9級特大地震影響爵政，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜陶缺，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,213評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一钾挟、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧饱岸，春花似錦掺出、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,204評論 0贊 19
一樁弒父案汤锨，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至黍衙，卻和暖如春泥畅，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背琅翻。一陣腳步聲響...
開封第一講書人閱讀 31,423評論 1贊 260
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留柑贞，地道東北人方椎。一個月前我還...
沈念sama閱讀 45,423評論 2贊 352
代替公主和親
正文我出身青樓，卻偏偏與公主長得像钧嘶，于是被迫代替她去往敵國和親棠众。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,722評論 2贊 345