【薦片】AlphaGo官方紀(jì)錄片

寫在前面:從人類發(fā)明語言之后恒界,主要的學(xué)習(xí)方式就是通過文字睦刃。但是,好的視頻十酣,尤其是紀(jì)錄片涩拙,卻能夠通過直觀的視覺际长,給我們更多的代入感。今天就先給大家推薦這一段吧兴泥。



alphago的官方紀(jì)錄片工育,帶你重溫2017年那激動人心的時刻。 先簡要交代下背景: 英文被稱作Go的圍棋郁轻,是誕生于中國翅娶,已經(jīng)具有三千年歷史的一項棋類運(yùn)動。和它的英文名字一樣好唯,其元素和規(guī)則非常簡單竭沫,但是變化卻非常多,被稱作最復(fù)雜的棋類項目骑篙。 DeepMind是一家位于倫敦的人工智能初創(chuàng)公司蜕提,他的創(chuàng)始人之一杰米斯·哈薩比斯,是英國青少年國際象棋冠軍靶端,他打算借助人工智能谎势,在最復(fù)雜的棋類項目上扛過機(jī)器對抗人類的大旗。 自從1997年IBM的深藍(lán)擊敗國際象棋世界冠軍卡斯帕羅夫之后杨名,科技界一直試圖在更復(fù)雜的圍棋領(lǐng)域用機(jī)器挑戰(zhàn)人類脏榆,但18年過去后,棋力最高的人工智能程序才能達(dá)到業(yè)余五段的圍棋水平台谍。DeepMind決心改變這一現(xiàn)狀须喂,在2014年啟動了AlphaGo項目(DeepMind也是在這一年被Google收購),他們的信心來自于近幾年機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的飛速發(fā)展趁蕊,使得機(jī)器具有了自我學(xué)習(xí)和進(jìn)化的能力坞生,至少從表面上看AlphaGo一兩年內(nèi)下的棋局,已經(jīng)遠(yuǎn)遠(yuǎn)超過職業(yè)棋手從小到大做下的棋局總數(shù)了掷伙。

這個紀(jì)錄片主要的內(nèi)容是己,就是AlphaGo和李世石之間的”人機(jī)大戰(zhàn)“。其中的幾個細(xì)節(jié)頗有看點:

博弈

圍棋是一種博弈的游戲任柜,在這個五番棋里卒废,雙方都試圖把局面搞得很復(fù)雜,讓對方琢磨不透宙地。職業(yè)棋手會通過對方思考的時間長短以及觀察對手的反應(yīng)升熊,來驗證自己的這種戰(zhàn)術(shù)是否成功了。但是這一次绸栅,李世石的對面只是幫助落子的黃仁杰博士,每一次落子都是1-2分鐘页屠,黃博士更是面無表情粹胯,根本無法觀察對方的反應(yīng)蓖柔。 圍棋在古代被稱為”手談“,可以說通過圍棋能夠?qū)崿F(xiàn)雙方的某種交流风纠,在這個五番棋的比賽中况鸣,唯一的交流就是棋譜,或者數(shù)據(jù)(對機(jī)器而言)竹观。

上帝之手

比賽中有兩手被反復(fù)提及(不劇透了)镐捧,一個由AlphaGo”創(chuàng)造“,出乎了所有人的意料臭增,但是仔細(xì)一分析懂酱,這一手將此前大家看不懂的復(fù)雜局面變得更明朗了,說明AlphaGo做了一個大局誊抛,主導(dǎo)了比賽列牺;此時的AlphaGo有48個TPU(張量處理器,機(jī)器學(xué)習(xí)專用芯片)拗窃,可以計算50步瞎领,所以布下這個局也不奇怪。 另一個随夸,則由李世石創(chuàng)造九默,出乎了AlphaGo的預(yù)料,這一首被古力成為”God Move“宾毒。在賽后的復(fù)盤中驼修,程序員說這一步發(fā)生的概率是十萬分之七。而李世石在賽后發(fā)布會上說當(dāng)時只有這個地方可以下伍俘。說明邪锌,李世石也在從前三局的失敗中進(jìn)行學(xué)習(xí),在跟AlphaGo比賽完的兩個月內(nèi)癌瘾,李世石保持全勝觅丰。

人機(jī)競合的魅力

”世紀(jì)之戰(zhàn)“改變了人工智能,也改變了圍棋這項運(yùn)動妨退。 “看起來不可能戰(zhàn)勝機(jī)器”妇萄,并沒有讓圍棋這項運(yùn)動失去魅力,卻讓這項運(yùn)動有了更高的知名度和廣泛參與度咬荷。據(jù)說冠句,在比賽結(jié)束后,圍棋的棋盤一度賣斷了貨幸乒。連李世石也表示懦底,AlphaGo的出現(xiàn),改變了圍棋這項運(yùn)動罕扎,他(作為對手的AlphaGo)提供了很多前人沒有想過的思路聚唐,讓圍棋有了更多的可能性丐重。說實話,我不懂圍棋杆查,在看這個紀(jì)錄片之前扮惦,只在武俠小說里,聽說過珍瓏棋局亲桦,這是個圍棋術(shù)語崖蜜,指全局性的巧妙創(chuàng)作,特點在于構(gòu)思奇巧客峭。而紀(jì)錄片中的上帝之手豫领,無疑就是現(xiàn)實版的珍瓏棋局。也許桃笙,隨著機(jī)器棋手的加入氏堤,在機(jī)器和人的“同伎壓力”下,會產(chǎn)生更多的珍瓏棋局搏明。

后續(xù)故事

在圍棋人機(jī)大戰(zhàn)總戰(zhàn)勝人類鼠锈,可以說人工智能摘取了智力運(yùn)動上的“明珠”。 AlphaGo仍在不斷迭代星著,他的下一個版本AlphaMaster购笆,在網(wǎng)絡(luò)上60比0,戰(zhàn)勝了一眾專業(yè)棋手虚循;然后在烏鎮(zhèn)3:0戰(zhàn)勝了柯潔同欠,1:0在與人類團(tuán)體賽中勝出。而且與戰(zhàn)勝李世石的具有48個TPU的分布式系統(tǒng)不同横缔,這一版只用了4個TPU的單機(jī)系統(tǒng)铺遂。

然后,AlphaGo就不屑于跟人類玩了茎刚,第三代AlphaGo Zero襟锐,基于神經(jīng)網(wǎng)絡(luò)完全重新開發(fā),絲毫不依賴人類的經(jīng)驗膛锭,只是自己跟自己下粮坞,“通過對自我的反思和獨有的創(chuàng)造力直接超越人類”。然后AplhaGo zero100:0完勝第一代AlphaGo(勝李世石版本)初狰,在跟第二代AlphaGo Master對戰(zhàn)中保持90%的勝率莫杈。

故事還沒有接觸,第四代叫做Alpha Zero(注意已經(jīng)去掉了Go)奢入,仍舊使用第三代算法筝闹,但是使用更通用的變量,可以應(yīng)用到其他的棋類項目,包括可能有平局的國家象棋(圍棋沒有平局)关顷。

但是肩杈,這絕不是DeppMind的最終目的。所有研究人工智能的公司解寝,其目標(biāo)都是研發(fā)出通用的人工智能,并能廣泛的應(yīng)用艘儒,然后反哺人工智能的算法和模型聋伦。

從DeepMind的官網(wǎng),可以看到通過使用AlphaGo中積累的AI技術(shù)界睁,DeepMind幫助谷歌的數(shù)據(jù)中心降低了40%的能耗(谷歌這錢花的值)觉增,Google Assistant中的語音識別技術(shù)也使用了DeepMind的卷積神經(jīng)網(wǎng)絡(luò)算法。相信在谷歌強(qiáng)大的計算能力和海量數(shù)據(jù)下翻斟,DeepMind會有更好更大的發(fā)展逾礁。



PS: DeepMind這種通過在特定規(guī)則的游戲中訓(xùn)練AI,從而獲得自我學(xué)習(xí)和進(jìn)化的能力(這有點像協(xié)同過濾了)的做法访惜,也得到了很多其他公司的效仿嘹履。在圍棋領(lǐng)域,就有Facebook债热、騰訊等公司砾嫉。還有諸如電競和其他棋牌領(lǐng)域。大家有興趣可自行圍觀窒篱。

雷鋒網(wǎng)的相關(guān)視頻匯總貼焕刮,匯集了2017年AI領(lǐng)域的一些比較淺顯一定的精華,我?guī)痛蠹液喴爬ㄈ缦拢?/p>

Libratus:卡耐基梅隴大學(xué)人工智能系統(tǒng)墙杯,在20天賽程里擊敗了德州撲克的職業(yè)選手配并,德州撲克背后的不完全信息博弈,與圍棋不同的是德州撲克的每一步?jīng)Q策高镐,都是以前所有步驟的條件概率溉旋。

OpenAI:在Dota2國際競標(biāo)賽現(xiàn)場1V1擊敗世界頂級玩家,這同樣是不依賴與人類經(jīng)驗避消,完全自主學(xué)習(xí)進(jìn)化的有一個例子低滩;

DeepMind的自動化神經(jīng)網(wǎng)絡(luò)架構(gòu):這個厲害了,聯(lián)合 CMU 提出一種結(jié)合模型結(jié)構(gòu)分層表示的高效架構(gòu)搜索方法岩喷,使用神經(jīng)網(wǎng)絡(luò)來設(shè)計神經(jīng)網(wǎng)絡(luò)恕沫,并且超過的人工設(shè)計的架構(gòu);

地表最強(qiáng)的國際象棋選手:對纱意,就是AlphaZero婶溯,同樣通過自主學(xué)習(xí),擊敗目前最強(qiáng)的國際象棋機(jī)器選手Stockfish(ELO分3300,比人類最高的卡爾森還高500分迄委,意味著勝率95%以上)褐筛;

當(dāng)然,少不了AI領(lǐng)域的大拿叙身,吳恩達(dá)渔扎、李飛飛、谷歌大腦團(tuán)隊以及深度學(xué)習(xí)之父Geoffrey Hinton信轿。 感興趣的童鞋請移步2017AI年度視頻晃痴。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市财忽,隨后出現(xiàn)的幾起案子倘核,更是在濱河造成了極大的恐慌,老刑警劉巖即彪,帶你破解...
    沈念sama閱讀 212,454評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件紧唱,死亡現(xiàn)場離奇詭異,居然都是意外死亡隶校,警方通過查閱死者的電腦和手機(jī)漏益,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,553評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來惠况,“玉大人遭庶,你說我怎么就攤上這事〕硗溃” “怎么了峦睡?”我有些...
    開封第一講書人閱讀 157,921評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長权埠。 經(jīng)常有香客問我榨了,道長,這世上最難降的妖魔是什么攘蔽? 我笑而不...
    開封第一講書人閱讀 56,648評論 1 284
  • 正文 為了忘掉前任龙屉,我火速辦了婚禮,結(jié)果婚禮上满俗,老公的妹妹穿的比我還像新娘转捕。我一直安慰自己,他們只是感情好唆垃,可當(dāng)我...
    茶點故事閱讀 65,770評論 6 386
  • 文/花漫 我一把揭開白布五芝。 她就那樣靜靜地躺著,像睡著了一般辕万。 火紅的嫁衣襯著肌膚如雪枢步。 梳的紋絲不亂的頭發(fā)上沉删,一...
    開封第一講書人閱讀 49,950評論 1 291
  • 那天,我揣著相機(jī)與錄音醉途,去河邊找鬼矾瑰。 笑死,一個胖子當(dāng)著我的面吹牛隘擎,可吹牛的內(nèi)容都是我干的殴穴。 我是一名探鬼主播,決...
    沈念sama閱讀 39,090評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼货葬,長吁一口氣:“原來是場噩夢啊……” “哼推正!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起宝惰,我...
    開封第一講書人閱讀 37,817評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎再沧,沒想到半個月后尼夺,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,275評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡炒瘸,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,592評論 2 327
  • 正文 我和宋清朗相戀三年淤堵,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片顷扩。...
    茶點故事閱讀 38,724評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡拐邪,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出隘截,到底是詐尸還是另有隱情扎阶,我是刑警寧澤,帶...
    沈念sama閱讀 34,409評論 4 333
  • 正文 年R本政府宣布婶芭,位于F島的核電站东臀,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏犀农。R本人自食惡果不足惜惰赋,卻給世界環(huán)境...
    茶點故事閱讀 40,052評論 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望呵哨。 院中可真熱鬧赁濒,春花似錦、人聲如沸孟害。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,815評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽纹坐。三九已至枝冀,卻和暖如春舞丛,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背果漾。 一陣腳步聲響...
    開封第一講書人閱讀 32,043評論 1 266
  • 我被黑心中介騙來泰國打工球切, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人绒障。 一個月前我還...
    沈念sama閱讀 46,503評論 2 361
  • 正文 我出身青樓吨凑,卻偏偏與公主長得像,于是被迫代替她去往敵國和親户辱。 傳聞我的和親對象是個殘疾皇子鸵钝,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,627評論 2 350