從0開始搭建產(chǎn)品經(jīng)理AI知識框架:機(jī)器學(xué)習(xí)2方法篇

上篇內(nèi)容介紹關(guān)于機(jī)器學(xué)習(xí)一些基礎(chǔ)概念的理解,今天深入的介紹機(jī)器學(xué)習(xí)的各種方式蚜厉,以及在產(chǎn)品中的有哪些應(yīng)用敲长。

機(jī)器學(xué)習(xí)都有哪些學(xué)習(xí)方式梨与?

涉及到機(jī)器學(xué)習(xí)相關(guān)知識:

  • 監(jiān)督學(xué)習(xí):需要“標(biāo)簽”當(dāng)老師凰锡,明確要預(yù)測什么未舟。
  • 無監(jiān)督學(xué)習(xí):不告訴機(jī)器正確答案圈暗,讓機(jī)器自己學(xué)習(xí),給出結(jié)果裕膀。
  • 半監(jiān)督學(xué)習(xí):訓(xùn)練的數(shù)據(jù)员串,只有一小部分是標(biāo)記過的,大部分是沒有標(biāo)記昼扛。
  • 強(qiáng)化學(xué)習(xí):通過反饋寸齐,邊實(shí)踐邊學(xué)習(xí)。
  • 遷移學(xué)習(xí):在某個垂直領(lǐng)域訓(xùn)練完成后野揪,移致去其他相關(guān)領(lǐng)域調(diào)優(yōu)發(fā)揮作用访忿。

監(jiān)督學(xué)習(xí)

什么是監(jiān)督學(xué)習(xí):

  • 概念:監(jiān)督學(xué)習(xí)就是通過樣例給定輸入與輸出瞧栗,讓程序?qū)W會一些通用的規(guī)則斯稳,這樣對于需要預(yù)測的數(shù)據(jù),得到輸出迹恐。
  • 詮釋:有一個明確預(yù)測的目標(biāo)挣惰,比如:預(yù)估房價(jià),給予機(jī)器大量的有標(biāo)簽的數(shù)據(jù)殴边,以及最終的銷售價(jià)憎茂,來訓(xùn)練這個模型。

監(jiān)督學(xué)習(xí)主要解決的是兩類問題:

  • 回歸問題:

    • 概念:預(yù)測結(jié)果是連續(xù)的锤岸,意味著我們嘗試將輸入變量映射到一些連續(xù)函數(shù)竖幔。
    • 舉例:如預(yù)測房價(jià)的例子,通過大量輸入輸出數(shù)據(jù)是偷,以及各種房屋類型拳氢,環(huán)境等標(biāo)簽,訓(xùn)練模型后蛋铆,輸入新的數(shù)據(jù)馋评,既可預(yù)測房價(jià)。
  • 分類問題:

    • 概念:預(yù)測結(jié)果是離散的刺啦,意味著我們嘗試將輸入變量映射到離散類別留特。
    • 舉例:如芒果的例子,同樣通過大量輸入輸出數(shù)據(jù)玛瘸,包括芒果蜕青,顏色,大小糊渊,形狀市咆,以及甜度,成熟度等標(biāo)簽再来,當(dāng)輸入新的數(shù)據(jù)蒙兰,機(jī)器計(jì)算出屬于這個芒果是在吃磷瘤,還是在不好吃的分類里。

監(jiān)督學(xué)習(xí)主要涉及到的算法模型如下:

  • 線性回歸模型(Linear Regression)
  • K-近鄰算法(k-Nearest Neighbors搜变,KNN)
  • 決策樹(Decision Trees)
  • 樸素貝葉斯(Naive Bayesian)
  • 邏輯回歸(Logistic Regression)

個人建議產(chǎn)品經(jīng)理對于算法重視采缚,初期知道解決的是什么問題即可,不要從學(xué)習(xí)的視角去深入挠他,而是實(shí)際遇到問題扳抽,遇到問題時候再研究。

無監(jiān)督學(xué)習(xí)

什么是無監(jiān)督學(xué)習(xí):

  • 詮釋:無監(jiān)督學(xué)習(xí)就是不給數(shù)據(jù)提供標(biāo)簽殖侵,由程序自動對數(shù)據(jù)進(jìn)行聚類贸呢、關(guān)聯(lián)、降維等工作拢军。
  • 詮釋:我們擁有大量的數(shù)據(jù)楞陷,但是不知道答案,需要用無監(jiān)督學(xué)習(xí)的方法茉唉,讓它們根據(jù)某些特征自動分成若干組固蛾,從而找到數(shù)據(jù)中存在的價(jià)值。

無監(jiān)督學(xué)習(xí)主要解決的三類問題:

  • 關(guān)聯(lián)

    • 概念:為了發(fā)現(xiàn)各種現(xiàn)象同時出現(xiàn)的概率度陆。
    • 舉例:經(jīng)典例子艾凯,男人買啤酒和買尿布的關(guān)聯(lián)性非常高,超市把啤酒和尿布放在一起懂傀,從而提高業(yè)績趾诗。
  • 聚類

    • 概念:把樣本分堆,使同一堆中的樣本之間很相似蹬蚁,而不同堆之間的樣本就有些差別恃泪。
    • 舉例:Google新聞,每天會搜集大量的新聞缚忧,然后把它們?nèi)烤垲愇虮茫蜁詣臃殖蓭资畟€不同的組(比如娛樂,科技闪水,政治......)糕非,每個組內(nèi)新聞都具有相似的內(nèi)容結(jié)構(gòu)。
  • 降維

    • 概念:降維意味著減少數(shù)據(jù)集中變量的個數(shù)球榆,但是仍然保留重要的信息朽肥。主要作用是壓縮數(shù)據(jù)與提升機(jī)器學(xué)習(xí)其他算法的效率。
    • 舉例:房價(jià)包含房子的長持钉、寬衡招、面積與房間數(shù)量四個特征,也就是維度為4維的數(shù)據(jù)每强。而面積=長 × 寬始腾,通過降維算法我們就可以去除冗余信息州刽,即從4維的數(shù)據(jù)壓縮到2維

無監(jiān)督學(xué)習(xí)主要涉及到的算法模型如下:

  • K 均值算法(K-means)
  • 自編碼(Autoencoding)
  • 主成分分析(Principal components analysis)
  • 隨機(jī)森林(Random forests)

同理,解決實(shí)際問題中浪箭,再深入到算法里提升自己的認(rèn)知穗椅。

半監(jiān)督學(xué)習(xí)

什么是半監(jiān)督學(xué)習(xí):

  • 概念:使用大量的未標(biāo)記數(shù)據(jù),以及同時使用標(biāo)記數(shù)據(jù)奶栖,來進(jìn)行模式識別工作匹表。
  • 詮釋:大概意思就是,監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)相結(jié)合的一種學(xué)習(xí)方法宣鄙,介于兩者之間袍镀。

半監(jiān)督學(xué)習(xí)解決問題:

  • 相比監(jiān)督學(xué)習(xí):節(jié)約人力成本,提高投入產(chǎn)出比冻晤。
  • 相比無監(jiān)督學(xué)習(xí):可以得到分配更高精度的模型苇羡。

具體適用場景的舉例:

  • 例如:視頻網(wǎng)站上有幾百萬的視頻,但其中只有幾十萬的視頻有標(biāo)簽明也,如果把剩下幾百萬視頻都打上標(biāo)簽宣虾,工作量和成本是巨大的惯裕,而用無監(jiān)督的方法温数,在很多情況下精度會很低,所以使用半監(jiān)督的方法蜻势,可以在節(jié)省人力的情況下撑刺,得到分類更高精度的模型。
  • 例如:垃圾信息過濾握玛,一般的方法是監(jiān)督够傍,需要大量的語料標(biāo)注,告知系統(tǒng)哪些可能是垃圾信息挠铲。但用戶產(chǎn)會生了大量的信息冕屯,且垃圾信息的發(fā)布者也在調(diào)整策略,無法進(jìn)行實(shí)時標(biāo)注拂苹,這里可以用半監(jiān)督的方法安聘,根據(jù)垃圾信息發(fā)布者的特殊行為,發(fā)布內(nèi)容等找到相似性瓢棒,進(jìn)行過濾浴韭。

強(qiáng)化學(xué)習(xí)

什么是強(qiáng)化學(xué)習(xí):

  • 概念:強(qiáng)化學(xué)習(xí)就是智能系統(tǒng)從環(huán)境到行為映射的學(xué)習(xí),以使獎勵信號(強(qiáng)化信號)函數(shù)值最大脯宿。如果Agent的某個行為策略導(dǎo)致環(huán)境正的獎賞(強(qiáng)化信號)念颈,那么Agent以后產(chǎn)生這個行為策略的趨勢便會加強(qiáng)。
  • 詮釋:針對沒有標(biāo)注數(shù)據(jù)集的情況而言连霉,通過反饋來區(qū)分是否越來越接近目標(biāo)榴芳。比如常見一個猜價(jià)格的游戲嗡靡,你來猜這個東西值多少錢,別人告訴你猜的價(jià)格是高了還是低了窟感。
  • 例如:阿爾法狗叽躯,自己跟自己下圍棋,通過一盤盤的勝負(fù)肌括,自我學(xué)習(xí)点骑、自我修煉、自我改正谍夭,然后一個一個迭代黑滴,自己跟自己下了1000萬盤之后,完全就是一個新的狗狗紧索。

強(qiáng)化學(xué)習(xí)和監(jiān)督學(xué)習(xí)的區(qū)別:

  • 監(jiān)督學(xué)習(xí)總的來說是一個開環(huán)的學(xué)習(xí)袁辈。

    • 通常,監(jiān)督學(xué)習(xí)任務(wù)會從環(huán)境中收集一批數(shù)據(jù)珠漂;
    • 接著我們用監(jiān)督學(xué)習(xí)算法從數(shù)據(jù)中產(chǎn)生模型晚缩;
    • 最后就可以用這個模型來做預(yù)測了。
  • 但是對于強(qiáng)化學(xué)習(xí)來說媳危,它面對的是一個閉環(huán)的學(xué)習(xí)荞彼。

    • 首先,也是從環(huán)境中產(chǎn)生數(shù)據(jù)待笑;
    • 用強(qiáng)化學(xué)習(xí)的算法從數(shù)據(jù)中產(chǎn)生模型鸣皂;
    • 還要把模型放回到環(huán)境中運(yùn)行,接著又會產(chǎn)生新的數(shù)據(jù)出來暮蹂,再重復(fù)以上步驟寞缝。

強(qiáng)化學(xué)習(xí)的應(yīng)用:

  • 例如:訓(xùn)練機(jī)器臂,把一個指的位置的物體仰泻,拿到另外一個指定的位置上荆陆,這里你不告訴它怎么做,讓他通過一遍遍的訓(xùn)練集侯,找到最佳的移動物體路徑被啼。
  • 例如:個性化推薦,當(dāng)推薦你某個分類內(nèi)容時候浅悉,你會點(diǎn)擊或查看趟据,它就會根據(jù)你的行為,推薦給你更多該分類的內(nèi)容术健。
  • 例如:無人機(jī)操作汹碱,指定你的無人機(jī)進(jìn)行某種動作飛行,通過強(qiáng)化學(xué)習(xí)來控制高度荞估,速度咳促,姿態(tài)等等稚新,根據(jù)獎勵讓它自己學(xué)習(xí)策略,來達(dá)到目的

遷移學(xué)習(xí)

什么是遷移學(xué)習(xí):

  • 概念:一般就是指要將從源領(lǐng)域?qū)W習(xí)到的東西應(yīng)用到目標(biāo)領(lǐng)域上去跪腹。
  • 詮釋:比如你會騎自行車褂删,你會控制車把,剎車冲茸,控訴屯阀,躲避,踩踏轴术,平衡感等等难衰,然后讓你騎摩托車時候,你也可以輕易上手逗栽,逐漸適應(yīng)速度和動力上的特殊性盖袭。

遷移學(xué)習(xí)應(yīng)用:

  • 模擬中學(xué)習(xí):不管是無人車,還是機(jī)械臂彼宠,在現(xiàn)實(shí)中學(xué)習(xí)耗時且昂貴鳄虱。通過模擬的方法,在虛擬中完成部分的訓(xùn)練凭峡,遷移到現(xiàn)實(shí)中拙已,當(dāng)然這種方法存在很多問題,畢竟虛擬世界無法做到跟現(xiàn)實(shí)一模一樣想罕,比如物理引擎悠栓,但是作為初始訓(xùn)練是可行的霉涨。
  • 適應(yīng)新領(lǐng)域:在線推薦系統(tǒng)中利用遷移學(xué)習(xí)按价,例如影像資料領(lǐng)域做好一個推薦系統(tǒng),然后應(yīng)用在稀疏的笙瑟、新的垂直領(lǐng)域書籍資料里楼镐。
  • 跨語言傳播知識:從一種語言學(xué)習(xí)然后將所得知識應(yīng)用于另一種語言,是遷移學(xué)習(xí)的另一個重要應(yīng)用往枷。比如英語訓(xùn)練之后框产,遷移到印度本土語言上。

以上就是本人對于機(jī)器學(xué)習(xí)中各種學(xué)習(xí)方式理解错洁,而其中的「深度學(xué)習(xí)」部分會單獨(dú)談?wù)勛约豪斫狻?/p>

AI PM認(rèn)知系列的相關(guān)閱讀:
第一篇:從0開始搭建產(chǎn)品經(jīng)理的AI認(rèn)知體系
第二篇:產(chǎn)品經(jīng)理的AI知識框架:計(jì)算機(jī)視覺
第三篇:產(chǎn)品經(jīng)理的AI知識框架:語音識別與合成
第四篇:產(chǎn)品經(jīng)理的AI知識框架:機(jī)器學(xué)習(xí)1基礎(chǔ)篇

作者:蘭楓秉宿,前騰訊游戲,新浪微博PM屯碴,Elex產(chǎn)品總監(jiān)描睦,連續(xù)創(chuàng)業(yè)者。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末导而,一起剝皮案震驚了整個濱河市忱叭,隨后出現(xiàn)的幾起案子隔崎,更是在濱河造成了極大的恐慌,老刑警劉巖韵丑,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件爵卒,死亡現(xiàn)場離奇詭異,居然都是意外死亡撵彻,警方通過查閱死者的電腦和手機(jī)钓株,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來陌僵,“玉大人享幽,你說我怎么就攤上這事∈捌” “怎么了值桩?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長豪椿。 經(jīng)常有香客問我奔坟,道長,這世上最難降的妖魔是什么搭盾? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任咳秉,我火速辦了婚禮,結(jié)果婚禮上鸯隅,老公的妹妹穿的比我還像新娘澜建。我一直安慰自己,他們只是感情好蝌以,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布炕舵。 她就那樣靜靜地躺著,像睡著了一般跟畅。 火紅的嫁衣襯著肌膚如雪咽筋。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天徊件,我揣著相機(jī)與錄音奸攻,去河邊找鬼。 笑死虱痕,一個胖子當(dāng)著我的面吹牛睹耐,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播部翘,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼硝训,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起捎迫,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤晃酒,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后窄绒,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體贝次,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年彰导,在試婚紗的時候發(fā)現(xiàn)自己被綠了蛔翅。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡位谋,死狀恐怖山析,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情掏父,我是刑警寧澤笋轨,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站赊淑,受9級特大地震影響爵政,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜陶缺,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一钾挟、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧饱岸,春花似錦掺出、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至黍衙,卻和暖如春泥畅,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背琅翻。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留柑贞,地道東北人方椎。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像钧嘶,于是被迫代替她去往敵國和親棠众。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容