AlphaGo怎么學(xué)五子棋——遷移學(xué)習(xí)

姓名:梁祥????????學(xué)號:17021210935

轉(zhuǎn)自:https://www.zhihu.com/question/41979241/answer/247421889

【嵌牛導(dǎo)讀】:傳統(tǒng)機(jī)器學(xué)習(xí)系統(tǒng)通常是作為某一領(lǐng)域的專家系統(tǒng)而進(jìn)行使用,這就導(dǎo)致了其適用性的降低束莫。作為廣義人工智能的需求溢十,突破狹隘的應(yīng)用領(lǐng)域是當(dāng)前的迫切需求僚祷。因此裹驰,遷移學(xué)習(xí)的思想應(yīng)運(yùn)而生浊仆。通過遷移學(xué)習(xí)的引領(lǐng)崎岂,說不定可以掀起未來人工智能的另一波高潮袱讹。

【嵌牛鼻子】:遷移學(xué)習(xí)同蜻、監(jiān)督學(xué)習(xí)棚点、機(jī)器學(xué)習(xí)、時(shí)效性

【嵌牛提問】:如何從當(dāng)前機(jī)器學(xué)習(xí)平滑過渡到遷移學(xué)習(xí)湾蔓?遷移學(xué)習(xí)和傳統(tǒng)學(xué)習(xí)方法有什么不同瘫析?

【嵌牛正文】:

1、前言

遷移學(xué)習(xí)(Transfer Learning,TL)對于人類來說默责,就是掌握舉一反三的學(xué)習(xí)能力贬循。比如我們學(xué)會騎自行車后,學(xué)騎摩托車就很簡單了桃序;在學(xué)會打羽毛球之后杖虾,再學(xué)打網(wǎng)球也就沒那么難了。對于計(jì)算機(jī)而言媒熊,所謂遷移學(xué)習(xí)亏掀,就是能讓現(xiàn)有的模型算法稍加調(diào)整即可應(yīng)用于一個(gè)新的領(lǐng)域和功能的一項(xiàng)技術(shù)。

不久前泛释,香港科技大學(xué)的楊強(qiáng)教授在機(jī)器之心GMIS大會中回顧AlphaGo和柯潔的圍棋大戰(zhàn)時(shí)曾說滤愕,AlphaGo 看上去像神一樣的存在,好像是無懈可擊怜校,而我們?nèi)绻麖臋C(jī)器學(xué)習(xí)的角度來看间影,它還是有弱點(diǎn)的,而且這個(gè)弱點(diǎn)還很嚴(yán)重茄茁。這個(gè)弱點(diǎn)即魂贬,AlphaGo不像人類一樣有遷移學(xué)習(xí)的能力。它不能在學(xué)會圍棋后裙顽,遷移到擁有下象棋的能力付燥,這一局限性需要遷移學(xué)習(xí)來攻破。另一位大牛吳恩達(dá)在NIPS 2016 tutorial中也曾表示非秤蹋看好遷移學(xué)習(xí)的應(yīng)用前景键科。他認(rèn)為遷移學(xué)習(xí)將是監(jiān)督學(xué)習(xí)之后的闻丑,在ML的商業(yè)應(yīng)用中得到成功的下一波動(dòng)力。現(xiàn)實(shí)世界紛繁復(fù)雜勋颖,包含眾多場景嗦嗡。遷移學(xué)習(xí)可以幫助我們透過現(xiàn)象抓住問題共性,巧妙處理新遇到的問題饭玲。

傳統(tǒng)機(jī)器學(xué)習(xí)通常有兩個(gè)基本假設(shè)侥祭,即訓(xùn)練樣本與測試樣本滿足獨(dú)立同分布的假設(shè)和必須有足夠可利用的訓(xùn)練樣本假設(shè)。然而茄厘,現(xiàn)實(shí)生活中這兩個(gè)基本假設(shè)有時(shí)往往難以滿足矮冬。比如,股票數(shù)據(jù)的時(shí)效性通常很強(qiáng)次哈,利用上個(gè)月數(shù)據(jù)訓(xùn)練出來的模型欢伏,往往很難順利地運(yùn)用到下個(gè)月的預(yù)測中去;比如公司開設(shè)新業(yè)務(wù)亿乳,但愁于沒有足夠的數(shù)據(jù)建立模型進(jìn)行用戶推薦硝拧。近年來在機(jī)器學(xué)習(xí)領(lǐng)域受到廣泛關(guān)注的遷移學(xué)習(xí)恰恰解決了這兩個(gè)問題。遷移學(xué)習(xí)用已有的知識來解決目標(biāo)領(lǐng)域中僅有少量有標(biāo)簽樣本數(shù)據(jù)甚至沒有數(shù)據(jù)的學(xué)習(xí)問題葛假,從根本上放寬了傳統(tǒng)機(jī)器學(xué)習(xí)的基本假設(shè)障陶。由于被賦予了人類特有的舉一反三的智慧,遷移學(xué)習(xí)能夠?qū)⑦m用于大數(shù)據(jù)的模型遷移到小數(shù)據(jù)上聊训,發(fā)現(xiàn)問題的共性抱究,從而將通用的模型遷移到個(gè)性化的數(shù)據(jù)上,實(shí)現(xiàn)個(gè)性化遷移带斑。

2鼓寺、遷移學(xué)習(xí)的一般化定義

條件:給定一個(gè)源域Ds和源域上的學(xué)習(xí)任務(wù)Ts,目標(biāo)域Dt和目標(biāo)域上的學(xué)習(xí)任務(wù)Tt

目標(biāo):用Ds和Ts學(xué)習(xí)目標(biāo)域上的預(yù)測函數(shù)f(·)

限制條件:Ds≠Dt勋磕,Ts≠Tt

3妈候、遷移學(xué)習(xí)的分類

3.1 按特征空間分類

同構(gòu)遷移學(xué)習(xí)(Homogeneous TL): 源域和目標(biāo)域的特征空間相同,XS=XT

異構(gòu)遷移學(xué)習(xí)(Heterogeneous TL):源域和目標(biāo)域的特征空間不同挂滓,XS≠XT

3.2 按遷移情景分類

歸納式遷移學(xué)習(xí)(Inductive TL):源域和目標(biāo)域的學(xué)習(xí)任務(wù)不同

直推式遷移學(xué)習(xí)(Transductive TL):源域和目標(biāo)域不同苦银,學(xué)習(xí)任務(wù)相同

無監(jiān)督遷移學(xué)習(xí)(Unsupervised TL):源域和目標(biāo)域均沒有標(biāo)簽

4、遷移學(xué)習(xí)的基本方法

a. 樣本遷移(Instance based TL)

在源域中找到與目標(biāo)域相似的數(shù)據(jù)赶站,把這個(gè)數(shù)據(jù)的權(quán)值進(jìn)行調(diào)整幔虏,使得新的數(shù)據(jù)與目標(biāo)域的數(shù)據(jù)進(jìn)行匹配。下圖的例子就是找到源域的例子3贝椿,然后加重該樣本的權(quán)值想括,使得在預(yù)測目標(biāo)域時(shí)的比重加大。優(yōu)點(diǎn)是方法簡單烙博,實(shí)現(xiàn)容易瑟蜈。缺點(diǎn)在于權(quán)重的選擇與相似度的度量依賴經(jīng)驗(yàn)烟逊,且源域與目標(biāo)域的數(shù)據(jù)分布往往不同。

b. 特征遷移(Feature based TL)

假設(shè)源域和目標(biāo)域含有一些共同的交叉特征踪栋,通過特征變換焙格,將源域和目標(biāo)域的特征變換到相同空間图毕,使得該空間中源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)具有相同分布的數(shù)據(jù)分布夷都,然后進(jìn)行傳統(tǒng)的機(jī)器學(xué)習(xí)。優(yōu)點(diǎn)是對大多數(shù)方法適用予颤,效果較好囤官。缺點(diǎn)在于難于求解,容易發(fā)生過適配蛤虐。

c. 模型遷移(Parameter based TL)

假設(shè)源域和目標(biāo)域共享模型參數(shù)党饮,是指將之前在源域中通過大量數(shù)據(jù)訓(xùn)練好的模型應(yīng)用到目標(biāo)域上進(jìn)行預(yù)測,比如利用上千萬的圖象來訓(xùn)練好一個(gè)圖象識別的系統(tǒng)驳庭,當(dāng)我們遇到一個(gè)新的圖象領(lǐng)域問題的時(shí)候刑顺,就不用再去找?guī)浊f個(gè)圖象來訓(xùn)練了,只需把原來訓(xùn)練好的模型遷移到新的領(lǐng)域饲常,在新的領(lǐng)域往往只需幾萬張圖片就夠蹲堂,同樣可以得到很高的精度。優(yōu)點(diǎn)是可以充分利用模型之間存在的相似性贝淤。缺點(diǎn)在于模型參數(shù)不易收斂柒竞。

d. 關(guān)系遷移(Relation based TL)

假設(shè)兩個(gè)域是相似的,那么它們之間會共享某種相似關(guān)系播聪,將源域中邏輯網(wǎng)絡(luò)關(guān)系應(yīng)用到目標(biāo)域上來進(jìn)行遷移朽基,比方說生物病毒傳播到計(jì)算機(jī)病毒傳播的遷移。

5离陶、遷移學(xué)習(xí)的應(yīng)用場景

5.1 遷移學(xué)習(xí)的理論研究價(jià)值

a. 解決標(biāo)注數(shù)據(jù)稀疏性

大數(shù)據(jù)時(shí)代億萬級別規(guī)模的數(shù)據(jù)導(dǎo)致數(shù)據(jù)的統(tǒng)計(jì)異構(gòu)性稼虎、標(biāo)注缺失問題越來越嚴(yán)重。標(biāo)注數(shù)據(jù)缺失會導(dǎo)致傳統(tǒng)監(jiān)督學(xué)習(xí)出現(xiàn)嚴(yán)重過擬合問題招刨。目前解決數(shù)據(jù)稀缺性的方法有傳統(tǒng)半監(jiān)督學(xué)習(xí)渡蜻、協(xié)同訓(xùn)練、主動(dòng)學(xué)習(xí)等计济,但這些方法都要求目標(biāo)域中存在一定程度的標(biāo)注數(shù)據(jù)茸苇,而在標(biāo)注數(shù)據(jù)稀缺的時(shí)候額外獲取人工標(biāo)注數(shù)據(jù)的代價(jià)太大。這時(shí)需要遷移學(xué)習(xí)來輔助提高目標(biāo)領(lǐng)域的學(xué)習(xí)效果沦寂。

b. 非平穩(wěn)泛化誤差分享

經(jīng)典統(tǒng)計(jì)學(xué)習(xí)理論給出了獨(dú)立同分布條件下模型的泛化誤差上界保證学密。而在非平穩(wěn)環(huán)境(不同數(shù)據(jù)域不服從獨(dú)立同分布假設(shè))中,傳統(tǒng)機(jī)器學(xué)習(xí)理論不再成立传藏,這給異構(gòu)數(shù)據(jù)分析挖掘帶來了理論風(fēng)險(xiǎn)腻暮。從廣義上看彤守,遷移學(xué)習(xí)可以看做是傳統(tǒng)機(jī)器學(xué)習(xí)在非平穩(wěn)環(huán)境下的推廣。因此在非平穩(wěn)環(huán)境下哭靖,遷移學(xué)習(xí)是對經(jīng)典機(jī)器學(xué)習(xí)的一個(gè)重要理論補(bǔ)充具垫。

5.2 遷移學(xué)習(xí)的實(shí)際應(yīng)用

a. 訓(xùn)練機(jī)械臂

在真實(shí)的機(jī)器人上訓(xùn)練模型太慢,而且非常昂貴试幽。解決辦法是先進(jìn)行模擬學(xué)習(xí)筝蚕,將模擬學(xué)習(xí)學(xué)到的知識遷移到現(xiàn)實(shí)世界的機(jī)器人訓(xùn)練中,這里源域和目標(biāo)域之間的特征空間是相同的。近年來該領(lǐng)域的研究又引發(fā)了許多人的興趣铺坞。下圖是谷歌DeepMind的工作:圖左是在模擬環(huán)境下訓(xùn)練機(jī)械臂的移動(dòng)起宽,訓(xùn)練好之后,可以把知識遷移到現(xiàn)實(shí)世界的機(jī)械臂上济榨,真實(shí)的機(jī)械臂稍加訓(xùn)練也可以達(dá)到非常好的效果坯沪,如下圖右。

b. 輿論分析

遷移學(xué)習(xí)也可應(yīng)用在輿論分析中的用戶評價(jià)上擒滑。以電子產(chǎn)品和視頻游戲產(chǎn)品用戶評價(jià)為例腐晾,圖中綠色為好評標(biāo)簽,而紅色為差評標(biāo)簽丐一。從圖左的電子產(chǎn)品評價(jià)(源域)中抽取特征藻糖,建立電子產(chǎn)品評價(jià)領(lǐng)域的模型,然后將其應(yīng)用到右圖的視頻游戲領(lǐng)域(目標(biāo)域)中钝诚,實(shí)現(xiàn)輿論大規(guī)模的遷移颖御,并且在新的領(lǐng)域不需要標(biāo)簽。

c. 推薦系統(tǒng)

遷移學(xué)習(xí)也可以用在推薦系統(tǒng)中凝颇,在某個(gè)領(lǐng)域做好一個(gè)推薦系統(tǒng)潘拱,然后應(yīng)用在稀疏的、新的垂直領(lǐng)域拧略。比如已成熟完善的電影推薦系統(tǒng)可以應(yīng)用在冷啟動(dòng)中的書籍推薦系統(tǒng)中芦岂。

d. 個(gè)性化對話

先訓(xùn)練一個(gè)通用型的對話系統(tǒng),然后再根據(jù)特定領(lǐng)域的小數(shù)據(jù)修正它垫蛆,使得這個(gè)對話系統(tǒng)適應(yīng)該特定領(lǐng)域的任務(wù)禽最。比如,一個(gè)用戶想買咖啡袱饭,他并不想回答所有繁瑣的問題川无,例如是問要大杯小杯,熱的冷的虑乖?

e. 數(shù)據(jù)生成式的遷移學(xué)習(xí)-GAN

生成式對抗網(wǎng)絡(luò)(GAN)是一個(gè)新的機(jī)器學(xué)習(xí)的思想懦趋。GAN模型中的兩位博弈方分別由生成式模型(generative model)和判別式模型(discriminative model)充當(dāng)。生成模型G捕捉樣本數(shù)據(jù)的分布疹味,用服從某一分布(均勻分布仅叫,高斯分布等)的噪聲z生成一個(gè)類似真實(shí)訓(xùn)練數(shù)據(jù)的樣本帜篇,追求效果是越像真實(shí)樣本越好;判別模型 D 是一個(gè)二分類器诫咱,估計(jì)一個(gè)樣本來自于訓(xùn)練數(shù)據(jù)(而非生成數(shù)據(jù))的概率笙隙,如果樣本來自于真實(shí)的訓(xùn)練數(shù)據(jù),D輸出大概率坎缭,否則竟痰,D輸出小概率。GAN的優(yōu)化是一個(gè)極小極大博弈問題幻锁,最終的目的是generator的輸出給discriminator時(shí)很難判斷是真實(shí)or偽造的凯亮。

如果我們有一個(gè)很好的生成式模型边臼,在某個(gè)數(shù)據(jù)集上已經(jīng)訓(xùn)練好了哄尔,如果有一些新的數(shù)據(jù),和前一個(gè)數(shù)據(jù)集有明顯的區(qū)別柠并,那么我們可以利用“GAN+邊界條件”岭接,把生成式模型遷移到新的數(shù)據(jù)分布上。比方說臼予,我們寫字的時(shí)候鸣戴,每個(gè)人簽名都是不同的,我們不會用印刷體來簽名粘拾,因?yàn)槲覀兠總€(gè)人都有自己的寫字的特點(diǎn)窄锅。那么,如果用大量的印刷體字作為第一部分的訓(xùn)練樣本缰雇,來訓(xùn)練一個(gè)不錯(cuò)的通用模型入偷,而用某個(gè)人手寫的斜體字做第二部分的訓(xùn)練樣本,就可以利用Wasserstein GAN把印刷體的模型遷移到個(gè)人的簽名械哟。也就是說疏之,這樣的簽名也就更具個(gè)性化特點(diǎn)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末暇咆,一起剝皮案震驚了整個(gè)濱河市锋爪,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌爸业,老刑警劉巖其骄,帶你破解...
    沈念sama閱讀 222,104評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異扯旷,居然都是意外死亡拯爽,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,816評論 3 399
  • 文/潘曉璐 我一進(jìn)店門薄霜,熙熙樓的掌柜王于貴愁眉苦臉地迎上來某抓,“玉大人纸兔,你說我怎么就攤上這事》窀保” “怎么了汉矿?”我有些...
    開封第一講書人閱讀 168,697評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長备禀。 經(jīng)常有香客問我洲拇,道長,這世上最難降的妖魔是什么曲尸? 我笑而不...
    開封第一講書人閱讀 59,836評論 1 298
  • 正文 為了忘掉前任赋续,我火速辦了婚禮,結(jié)果婚禮上另患,老公的妹妹穿的比我還像新娘纽乱。我一直安慰自己,他們只是感情好昆箕,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,851評論 6 397
  • 文/花漫 我一把揭開白布鸦列。 她就那樣靜靜地躺著,像睡著了一般鹏倘。 火紅的嫁衣襯著肌膚如雪薯嗤。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,441評論 1 310
  • 那天纤泵,我揣著相機(jī)與錄音骆姐,去河邊找鬼。 笑死捏题,一個(gè)胖子當(dāng)著我的面吹牛玻褪,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播涉馅,決...
    沈念sama閱讀 40,992評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼归园,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了稚矿?” 一聲冷哼從身側(cè)響起庸诱,我...
    開封第一講書人閱讀 39,899評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎晤揣,沒想到半個(gè)月后桥爽,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,457評論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡昧识,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,529評論 3 341
  • 正文 我和宋清朗相戀三年钠四,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,664評論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡缀去,死狀恐怖侣灶,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情缕碎,我是刑警寧澤褥影,帶...
    沈念sama閱讀 36,346評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站咏雌,受9級特大地震影響凡怎,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜赊抖,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,025評論 3 334
  • 文/蒙蒙 一统倒、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧氛雪,春花似錦房匆、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,511評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽墓猎。三九已至捆昏,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間毙沾,已是汗流浹背骗卜。 一陣腳步聲響...
    開封第一講書人閱讀 33,611評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留左胞,地道東北人寇仓。 一個(gè)月前我還...
    沈念sama閱讀 49,081評論 3 377
  • 正文 我出身青樓,卻偏偏與公主長得像烤宙,于是被迫代替她去往敵國和親遍烦。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,675評論 2 359

推薦閱讀更多精彩內(nèi)容