在今年5月烏鎮(zhèn)舉辦的圍棋“人機(jī)大戰(zhàn)”中废封,谷歌人工智能AlphaGo Master版以3:0戰(zhàn)勝世界排名第一的中國(guó)棋手柯潔九段,并在此之后“光榮退役”十饥。這個(gè)結(jié)果讓柯潔本人和所有圍棋選手都看到了AI的強(qiáng)大和難以戰(zhàn)勝窟勃。
不過(guò),近日的消息可能讓柯潔喜憂(yōu)參半逗堵。好消息是秉氧,柯潔大仇得報(bào),那位退休的AI圍棋大師(AlphaGo Master)被打敗了蜒秤,而且敗的很慘汁咏;壞消息是,打敗它的是Master的升級(jí)版AlphaGo Zero垦藏,更強(qiáng)的人工智能棋手梆暖。
而且從柯潔的微博來(lái)看,他感覺(jué)貌似是憂(yōu)大于喜掂骏,比較不爽:
柯潔對(duì)于更強(qiáng)大的圍棋AI轰驳,甚至是人工智能來(lái)說(shuō),看法有些悲觀弟灼,甚至說(shuō)出了“人類(lèi)太多余”這種話(huà)级解。但實(shí)際上真像他認(rèn)為的這樣嗎?
10月19日田绑,DeepMind在《自然》雜志(Nature)上發(fā)表論文勤哗。在這篇名為《Mastering the game of Go without human knowledge》(《不使用人類(lèi)知識(shí)掌握圍棋》)的論文中,DeepMind展示了他們更強(qiáng)大的新版本圍棋程序AlphaGo Zero掩驱,經(jīng)過(guò)3天的自我學(xué)習(xí)芒划,以100:0的比分完勝對(duì)陣?yán)钍朗呐f版AlphaGo。
此時(shí)它對(duì)陣AlphaGo Master的成績(jī)?yōu)閴旱剐缘?9:11欧穴,Master則是上面提到打敗柯潔的版本民逼;而經(jīng)過(guò)40天的自我對(duì)弈之后,它最終以100戰(zhàn)全勝的成績(jī)?nèi)娉搅薃lphaGo Master涮帘。這驗(yàn)證了即使在像圍棋這樣最具挑戰(zhàn)性的領(lǐng)域拼苍,人工智能也可以通過(guò)純強(qiáng)化學(xué)習(xí)的方法自我完善達(dá)到目的。
那么调缨,如此強(qiáng)大的人工智能只能用來(lái)在圍棋界獨(dú)孤求敗嗎疮鲫?正如馬云的疑問(wèn)“計(jì)算機(jī)下棋再?gòu)?qiáng)吆你,有什么用?”俊犯,其實(shí)用處還是很多的妇多。AlphaGo Zero今天贏了圍棋,明天就能舉一反三瘫析,做更多有實(shí)際意義的事砌梆,例如:
1、省電
每次AlphaGo的升級(jí)都伴隨著算法的優(yōu)化和硬件資源的節(jié)省贬循,耗電量也是直線(xiàn)下降咸包,如下圖所示,目前為止4個(gè)版本的AlphaGo耗電量對(duì)比如下:
今年上半年谷歌方面曾經(jīng)公布了其在2015年全年的數(shù)據(jù)中心耗電情況杖虾,當(dāng)時(shí)谷歌一年的用電量為57億千瓦時(shí)烂瘫,如果以北京這種高人均用電的大城市做對(duì)比,這相當(dāng)于北京712萬(wàn)人的用電量奇适。在這樣的數(shù)字上坟比,僅僅是節(jié)省10%,也能夠?qū)Τ杀竞铜h(huán)境造成巨大影響嚷往。根據(jù)Deepmind的估算葛账,如果全面推動(dòng)AI實(shí)裝到數(shù)據(jù)中心的話(huà),最高可以達(dá)到15%的用電削減皮仁。
2籍琳、省錢(qián)
人工智能自我學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的能力會(huì)讓?xiě)?yīng)用該技術(shù)的領(lǐng)域資源消耗量大幅縮減,省錢(qián)省時(shí)贷祈。比如在模擬蛋白質(zhì)折疊研發(fā)新藥趋急、尋找新的化合材料等一些缺少數(shù)據(jù)或數(shù)據(jù)異常昂貴的領(lǐng)域,AlphaGo Zero的自我學(xué)習(xí)能力可以通過(guò)計(jì)算和模擬填補(bǔ)數(shù)據(jù)量不足的劣勢(shì)势誊,而且還不需要使用大量硬件來(lái)完成計(jì)算呜达。這一點(diǎn)從AlphaGo進(jìn)化過(guò)程中不斷減少硬件消耗就可以看出。
3粟耻、省時(shí)
強(qiáng)大的計(jì)算和學(xué)習(xí)能力還可以大幅縮短整個(gè)工程完成的時(shí)間查近。例如“人類(lèi)基因組計(jì)劃”——對(duì)一個(gè)人的23對(duì)染色體進(jìn)行全量測(cè)序。這個(gè)耗時(shí)13年挤忙,耗資超過(guò)10億美元嗦嗡,由美國(guó),中國(guó)饭玲,英國(guó),日本叁执,法國(guó)和德國(guó)6個(gè)國(guó)家20多所大學(xué)和研究機(jī)構(gòu)完成的“世紀(jì)工程”茄厘,如今如果利用機(jī)器學(xué)習(xí)“再做一次”的周期大約為兩周矮冬,成本大約為2萬(wàn)美金。而包括英特爾次哈、華大基因胎署、IBM和谷歌等在內(nèi)的新科技公司,正在力圖在2020年把這個(gè)數(shù)字降到24小時(shí)窑滞,1000美元琼牧。
再說(shuō)一下全量基因測(cè)序的意義,這可以被認(rèn)為是人類(lèi)“攻克癌癥”的重要一步哀卫,無(wú)論是在癌癥的預(yù)防巨坊、篩查、優(yōu)生還是對(duì)癌癥藥物的研究和治療上此改,都會(huì)徹底改變現(xiàn)有癌癥的現(xiàn)有診療方式趾撵。
毫無(wú)疑問(wèn),人工智能擁有探索新知識(shí)的潛能共啃,這點(diǎn)將讓全人類(lèi)受益占调。DeepMind也強(qiáng)調(diào),AlphaGo與人類(lèi)的關(guān)系絕不是對(duì)立的移剪,反而是能夠啟發(fā)人類(lèi)把這些新發(fā)現(xiàn)應(yīng)用到其他新領(lǐng)域究珊,以解決當(dāng)前我們正面臨的一些最重要最迫切的科學(xué)挑戰(zhàn)。
目前看來(lái)纵苛,AlphaGo Zero的實(shí)際意義并不像柯潔所看到的那樣悲觀剿涮,和人類(lèi)誕生以來(lái)發(fā)明的工具一樣,人工智能無(wú)非也是彌補(bǔ)短板赶站,幫助人類(lèi)更好的戰(zhàn)勝困難幔虏。AI比人類(lèi)在某些方面強(qiáng)大是理所應(yīng)當(dāng),就像汽車(chē)比人跑得快贝椿,只要運(yùn)用合理想括,人工智能只能讓我們的生活更美好。