原創(chuàng)?君?DeepTech深科技
據(jù) DT 君從現(xiàn)場發(fā)來消息护蝶,就在剛剛占哟,谷歌攜手中國圍棋協(xié)會和浙江省體育局在位于北京的中國棋院就“中國烏鎮(zhèn)?·?圍棋峰會”召開了新聞發(fā)布會心墅。據(jù)發(fā)布會宣布,此次圍棋峰會將于 5 月 22 到 27 日在中國桐鄉(xiāng)烏鎮(zhèn)舉行重挑,5月22日是活動報道日嗓化。而其中最為人關(guān)注的是,在開賽的前三天中?AlphaGo 與柯潔之間的三番棋對弈谬哀。
柯潔致辭:抱有必勝的心態(tài)和必死的信念
據(jù)發(fā)布會現(xiàn)場提供的材料刺覆,在比賽的后兩天,峰會還將舉辦配對賽和團隊賽兩場形式各異的交流比賽史煎。在配對賽中谦屑,兩位棋手將分別與 AlphaGo 組隊,挑戰(zhàn)棋手如何理解AlphaGo獨特風(fēng)格并與之合作篇梭;在團體賽中氢橙,將由五位中國頂尖棋手合作,建立棋手“神經(jīng)網(wǎng)絡(luò)”恬偷,降低心里因素的影響悍手,從而做出更加客觀的判斷。
谷歌大中華區(qū)總裁石博盟致辭
據(jù)悉,此次參戰(zhàn)的 AlphaGo 2.0 可能采用了全新的算法模型坦康,即未先學(xué)習(xí)人類棋譜再下棋的經(jīng)驗竣付,而是直接通過對戰(zhàn)來獲得認(rèn)知和能力。這與此前被“喂”了無數(shù)份人類棋譜的 AlphaGo 1.0 完全不同滞欠。
DeepMind 創(chuàng)始人戴密斯·哈薩比斯視頻致辭
根據(jù)發(fā)布會提供的材料古胆,AlphaGo的做法是使用了蒙特卡洛樹搜索與評估網(wǎng)絡(luò)(Value Network)和走棋網(wǎng)絡(luò)(Policy Network)兩個深度神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,其中一個是以估值網(wǎng)絡(luò)來評估大量的選點筛璧,而以走棋網(wǎng)絡(luò)來選擇落子逸绎。在這種設(shè)計下,電腦可以結(jié)合樹狀圖的長遠(yuǎn)推斷夭谤,又可像人類的大腦一樣自發(fā)學(xué)習(xí)進行直覺訓(xùn)練棺牧,以提高下棋實力。
DeepMind創(chuàng)始人哈薩比斯剛剛發(fā)推文表示對烏鎮(zhèn)對決充滿期待
但現(xiàn)在的 AlphaGo 2.0 到底進化成什么樣朗儒,恐怕只有比賽開始后才能一探究竟了陨帆。
2016 年 3 月,AlphaGo 1.0 在圍棋人機大戰(zhàn)中“一戰(zhàn)成名”采蚀,以 4:1 的成績打敗韓國名將李世石九段——這場勝利甚至可以說是開啟了人工智能走向大眾的新認(rèn)知時代。
事后承二,李世石這樣描述他與 AlphaGo 1.0 對戰(zhàn)的感覺:“面對毫無感情的對手是非常難受的榆鼠,這讓我有種再也不想跟它比賽的感覺” 。
值得一提的是亥鸠,李世石當(dāng)時還不知道谷歌為這一勝利準(zhǔn)備了一個秘密武器——一種專屬的機器學(xué)習(xí)處理器“張量處理單元”(Tensor Processing Unit, TPU)妆够。在當(dāng)時的比賽中,TPU 幫助 AlphaGo 1.0 更快地 “思考”负蚊、更好地預(yù)判局勢神妹。
在 2016 年 5 月份,谷歌首次證實了“TPU”的存在家妆,但并沒有披露相關(guān)的技術(shù)細(xì)節(jié)鸵荠,外界只知道在谷歌街景、AlphaGo 等應(yīng)用中用到了TPU伤极。谷歌自己就稱蛹找,在 AlphaGo 戰(zhàn)勝李世石的比賽中,AlphaGo 能夠做出更快更準(zhǔn)的判斷哨坪,大部分功勞要歸于TPU庸疾。
根據(jù)谷歌就在近日發(fā)布的論文顯示,在功耗效率測試中当编,TPU目前的性能要優(yōu)于常規(guī)的處理器30 到 80 倍届慈;而同傳統(tǒng)的GPU /?CPU的計算組合相比?,TPU的處理速度也要快上15 到 30 倍。最為關(guān)鍵的是金顿,由于TPU的運用臊泌,就連深度神經(jīng)網(wǎng)絡(luò)所需要的代碼數(shù)量也大幅的減少,僅僅需要 100 到 1500 行代碼就可以順暢運行串绩。
谷歌關(guān)于此次活動的宣傳視頻
DeepMind 創(chuàng)始人戴密斯·哈薩比斯今年 1 月 17 日出席 DLD(數(shù)字缺虐、生活、設(shè)計)創(chuàng)新大會上說:“AlphaGo 為谷歌公司節(jié)省了大量的電力消耗礁凡。谷歌數(shù)據(jù)中心每天的用電量驚人高氮,我們就通過 AlphaGo 的算法合理配置冷卻裝置。結(jié)果用于冷卻裝置的能源消耗減少40%顷牌,從而使整個數(shù)據(jù)中心的總電力消耗減少了15%剪芍。”
可以想象窟蓝,即便沒有被“喂棋譜”罪裹,如此強大配置之下的 AlphaGo 2.0 有可能將是柯潔難以超越的對手。
實際上运挫,就在 2017 年年初状共,AlphaGo 化名為 Master 橫掃棋壇,以 60 比 0 大勝中日韓圍棋高手谁帕,其中包括聶衛(wèi)平峡继、柯潔(是的,柯潔已經(jīng)輸過一次了)匈挖、樸廷桓碾牌、井山裕太等。對于 Master 的路數(shù)儡循,有棋手表示“看不懂”舶吗,幾乎每一盤棋Master都有讓職業(yè)高手找不到北的走法。
這在當(dāng)時引起了不少人的困惑择膝。AlphaGo1.0 的風(fēng)格趨于保守誓琼,偏向于選擇那些最終贏棋概率較大,但所贏目數(shù)較少的棋步调榄,而 Master 的“棋風(fēng)”大變踊赠,原因何在?
谷歌 DeepMind 公司創(chuàng)始人戴密斯·哈薩比斯(如上圖)曾在一次采訪中透露每庆,他們正在嘗試訓(xùn)練一個沒有學(xué)習(xí)過人類棋譜的人工智能筐带。或許 Master 正是 AlphaGo1.0 和 2.0 之間的過渡產(chǎn)品,也或許 Master 正是 AlphaGo2.0 本身缤灵。
2016 年 11 月的時候伦籍,AlphaGo 團隊的發(fā)言人樊麾通過微博宣布:“我們很高興向大家宣布蓝晒,AlphaGo 的棋力在已過半年有巨大的進步,將在2017年初復(fù)出下棋,我們團隊會在近期內(nèi)公布更多訊息” ——這個“巨大進步”耐人尋味帖鸦。
據(jù) DeepMind 介紹芝薇, AlphaGo 1.0 是“深度學(xué)習(xí)”人類棋譜得出圍棋手?jǐn)?shù)的估值,但 1.0 版本的 AlphaGo 所走招法其實并沒有超出人類理解范圍作儿,而且也是人類棋手用過的方法洛二。
但是,如果 AlphaGo 1.0 完善了攻锰,就意味著得出了接近完美的圍棋手?jǐn)?shù)估值函數(shù)晾嘶,而 AlphaGo 2.0 則是利用這個估值函數(shù)進行自我對局和“深度學(xué)習(xí)”,不再受人類棋譜的局限娶吞,下出真正屬于“人工智能”的圍棋垒迂。
那么這次與柯潔之間的新戰(zhàn)役,是否意味著 AlphaGo1.0 就這么退出歷史舞臺了呢妒蛇?
2016 年机断,AlphaGo1.0 戰(zhàn)勝李世石之后,谷歌在《Nature》上公布了其詳細(xì)的研究結(jié)果绣夺。2017 年 4 月 2 日吏奸,馬化騰在中國 IT 領(lǐng)袖峰會上公開表示他對谷歌此舉的感激之情,因為騰訊的圍棋AI“絕藝”不久前在日本 UEC 比賽中獲得冠軍陶耍。
“如果沒有 Google 的 paper(論文)苦丁,我們也做不出來”,馬化騰表示物臂。
據(jù)報道,除了絕藝之外产上,日本的 DeepZenGo棵磷、比利時的“麗拉”等圍棋 AI 新秀,都受到了 2016 年谷歌在《自然》雜志上發(fā)表的關(guān)于 AlphaGo 論文啟發(fā)晋涣∫敲剑可以說,當(dāng)年公布的 AlphaGo 1.0 研究結(jié)果還在“哺育”著整個圍棋人工智能領(lǐng)域谢鹊。
去年年底算吩,Google 宣布將 DeepMind 源代碼進行開源,上傳到 Github 上佃扼。Google 希望偎巢,以此增加 AI 能力的開放性,讓更多開發(fā)者參與 AI 研究兼耀,觀察其他開發(fā)者是否能夠挑戰(zhàn)并打破 DeepMind 現(xiàn)在的紀(jì)錄压昼。
而就在近日求冷,DeepMind 宣布已經(jīng)開源了最新的深度學(xué)習(xí)框架 Sonnet,將被用于與 TensorFlow 進行協(xié)同工作窍霞,開發(fā)者從此能夠更方便匠题、直接地構(gòu)建復(fù)雜神經(jīng)網(wǎng)絡(luò)模型。
不久前但金,DeepMind 創(chuàng)始人戴密斯·哈薩比斯曾表示:“2017年將是 AlphaGo 與棋界興奮的一年”韭山。這一次,他們又會帶來什么樣的驚喜冷溃?
湊巧的是钱磅,馬云在 4 月 2 日的中國IT領(lǐng)袖峰會上對AlphaGo “隔空喊話”:“AlphaGo 贏了李世石,so what秃诵?下圍棋本來的樂趣就是對方下一把臭棋续搀,結(jié)果機器不會下臭棋,那還有什么事情呢菠净?”
或許禁舷,我們也可以期待 AlphaGo 在這次 PK 中能下一把令人稱絕的臭棋。但如果你希望能去圍觀毅往,可以著手準(zhǔn)備去烏鎮(zhèn)了牵咙,據(jù)說當(dāng)?shù)乜头恳呀?jīng)很緊張了。
免費參加InnoTalk沙龍-InnoTalk-從人工智能在金融領(lǐng)域的應(yīng)用創(chuàng)新看未來發(fā)展機會: