AlphaStar來了

這兩天出現(xiàn)了兩個我認(rèn)為比較重要的新聞,一是中國隊(duì)0:3負(fù)于伊朗丧凤,引發(fā)里皮暴怒,這個失敗我覺得倒沒什么步脓,不用太在意愿待,一方面是與伊朗的實(shí)力差距明顯,另一方面是里皮在亞洲杯前就明確表示不會續(xù)簽合同沪编,也就是說他肯定不會帶領(lǐng)中國隊(duì)沖擊下屆世界杯了呼盆。那么8強(qiáng)相對來說還是一個對中國來說最好的結(jié)果,如果真讓中國這次取得4強(qiáng)以上的成績蚁廓。那么访圃,對中國足球來說才是一個麻煩。為什么這么說呢相嵌,因?yàn)橥仁保凑漳壳暗拿~分配來說况脆,亞洲前四是可以保證進(jìn)入世界杯決賽圈的。如果這次亞洲杯國足打進(jìn)前四批糟,那么格了,不光會導(dǎo)致這批球員弄不清自己的斤兩,對于球迷和整個足球環(huán)境也就有了更高的期待徽鼎,這對于里皮的接任者來說盛末,無疑就是災(zāi)難,任何一場比賽出現(xiàn)問題都會導(dǎo)致傾覆的命運(yùn)否淤,這必將形成新教練對自己戰(zhàn)術(shù)體系的磨練和推行以及和選材的阻力悄但,如果連戰(zhàn)術(shù)體系都不能實(shí)戰(zhàn)演練,能取得好成績就是白日做夢吧石抡,而且國家隊(duì)這些三十好幾的大齡青年檐嚣,你真指望他們兩年之后和40歲的小將鄭智一起再次沖擊世界杯?從我的感受客觀來說啰扛,8強(qiáng)符合國足的定位和實(shí)力嚎京,我始終覺得,中國足球?qū)嵙Σ⒉幌衩襟w和大家認(rèn)為的那樣不堪隐解,但是要說具有亞洲頂尖的水準(zhǔn)鞍帝,肯定也不是。但是只要戰(zhàn)術(shù)得當(dāng)厢漩,加上一些運(yùn)氣膜眠,跳一跳岩臣,完全是可以沖擊世界杯決賽圈的溜嗜。所以,8強(qiáng)這個成績很好架谎,既能讓人腳踏實(shí)地炸宵,又對未來有希望。

另一個新聞則是昨天DeepMind出品的AlphaStar首次公開亮相對陣頂尖人類選手Liquid 戰(zhàn)隊(duì)的MaNa谷扣,AlphaStar在比賽中期被MaNa使用棱鏡空投不朽騷擾主礦經(jīng)濟(jì)時土全,陷入循環(huán)困境,兵力一直在無效運(yùn)動会涎,錯過壓制時機(jī)裹匙,最終告負(fù)。盡管是在公開賽中首戰(zhàn)失敗末秃,但是AlphaStar在之前分別與TLO和MaNa的五場比賽中概页,都是以5比0橫掃,這場比賽的失利练慕,其實(shí)更像是MaNa利用了AlphaStar的bug惰匙。毫無疑問技掏,人類和ai在微操上的差距不知道要用幾個量級來衡量。所以為了公平起見项鬼,比賽中對AlphaStar做出了apm<180的限制哑梳,而對人類選手則禁止使用一些非常規(guī)戰(zhàn)術(shù)。

從近年Alphago和AlphaStar和表現(xiàn)看來绘盟,人工智能的崛起已經(jīng)不可阻擋鸠真,我對人工智能的理解分為以下四個階段,為了舉例和理解簡單方便龄毡,我拿最簡單的一元一次線性方程來進(jìn)行說明弧哎,實(shí)際情況肯定比這個方程復(fù)雜,請不要對此太糾結(jié)稚虎。

階段一:y=kx+b撤嫩,k已知,b已知蠢终,給定x約束下序攘,求最優(yōu)解y。

這個是我們?nèi)粘6寄芘龅降那闆r寻拂,我們可以輕松的使用計(jì)算器和電腦求解程奠,這個階段AI早已經(jīng)輕松突破,這個階段甚至根本談不上AI祭钉。

階段二:y=kx+b瞄沙,k未知,b未知慌核,給定x約束下距境,求最優(yōu)解y。

這個階段垮卓,可以粗略對應(yīng)于AI在國際象棋和圍棋領(lǐng)域與人類的對戰(zhàn)垫桂,前幾年Alphago輕松戰(zhàn)勝李世石和柯潔。不說民用粟按,至少在實(shí)驗(yàn)室條件下诬滩,AI幾年前已經(jīng)突破。

階段三:

k灭将,b疼鸟,α、β庙曙、δ矢沿。稻据。蕾域。都未知,而且α馋袜、β、δ舶斧。欣鳖。。取值不固定茴厉,在給定x約束下泽台,求最優(yōu)解y。(我勒個擦矾缓,公眾號公式弄不了下標(biāo)怀酷,只能截圖啊J任拧)

這個階段對應(yīng)的就是我們看到的星際2蜕依,AlphaStar VS MaNa,AI面對的是多變量多權(quán)重開放動態(tài)性復(fù)雜求解琉雳,而且對應(yīng)于y1样眠、y2。翠肘。檐束。yi,權(quán)重α、β束倍、δ被丧。。绪妹。會不停變化甥桂,到這里就有點(diǎn)繞了,我結(jié)合實(shí)例仔細(xì)講一下喂急,玩過即時戰(zhàn)略游戲的人都知道游戲取勝是由一些目標(biāo)結(jié)合起來實(shí)現(xiàn)的格嘁,比如開局是資源的獲取笛求,這里可以當(dāng)成是y1廊移,然后是修建建筑、制造作戰(zhàn)單位探入,這里想像成y2狡孔、y3。游戲中期就是攻擊對方的建筑和單位蜂嗽,限制對方的資源采集和發(fā)展苗膝,這里是y4、y5植旧、y6辱揭、y7.最后是決戰(zhàn)离唐,殲滅對方的建筑和單位,y8问窃,y9.當(dāng)然亥鬓,還有其他等等,無法一一枚舉域庇。最終取得游戲勝利y=αy1+βy2+...嵌戈。在游戲過程中,各分項(xiàng)指標(biāo)y1听皿、y2熟呛、...、肯定都是越大越好尉姨,但是分項(xiàng)指標(biāo)對最終結(jié)果y的影響權(quán)重又是不一樣的庵朝,而且在不同的階段、時期以及根據(jù)對手的戰(zhàn)術(shù)不同還會變化又厉,這尼瑪偿短,簡直就是一堆亂麻啊馋没!而針對這種復(fù)雜的情況昔逗,DeepMind給AlphaStar設(shè)計(jì)的是完全不同于第二階段的一套算法。(下面這段是來源于DeepMind的項(xiàng)目領(lǐng)導(dǎo)者David Silver的引文)

“像 AlphaGo 和 AlphaZero 這樣的基于搜索的方法更難適應(yīng)不完美信息博弈篷朵。例如勾怒,基于搜索的德州撲克算法(比如 DeepStack 和 Libratus)通過信念狀態(tài)推測對手的手牌。與之不同的是声旺,AlphaStar 是一種無模型的強(qiáng)化學(xué)習(xí)算法笔链,可以間接地推理對手狀態(tài),即通過學(xué)習(xí)行為這一最有效擊敗對手的方法腮猖,而不是試圖給對手看到什么建模鉴扫。可以認(rèn)為澈缺,這是應(yīng)對不完整信息的一個有效方法坪创。

另一方面,不完美信息游戲沒有絕對最佳的游戲方式姐赡,而是取決于對手的行為莱预。這就是星際爭霸如此讓人著迷的原因,就像「石頭剪刀布」一樣项滑,所有決策都有優(yōu)勢劣勢依沮。這就是我們使用 AlphaStar 聯(lián)賽,以及為什么策略空間的所有角落都如此重要的原因——在圍棋這樣的游戲里這是不重要的,掌握了最優(yōu)策略就可以擊敗所有對手危喉∷斡妫”

從這里可以看見,針對于第二階段圍棋那樣的應(yīng)用場景AlphaGo是通過建模辜限,使用深度學(xué)習(xí)加蒙特卡洛的剪枝和搜索傻谁,量化確定最優(yōu)解。也就是說在第二個階段適用的場景下列粪,因?yàn)橐?guī)則和邊界簡單清晰审磁,AI找到最優(yōu)算法后,幾乎可以窮盡變化岂座,人類是不可能戰(zhàn)勝AI的态蒂,這也就是為什么AlphaGo在戰(zhàn)勝排名第一的柯潔之后,DeepMind不再進(jìn)行后續(xù)研發(fā)和投入的原因费什。

而在第三階段則不同钾恢,由于所面對的環(huán)境和條件更復(fù)雜,沒有辦法找到通用性的算法鸳址,AI這是通過學(xué)習(xí)和積累人類和Alpha自己對戰(zhàn)的總結(jié)和積累瘩蚪,無限逼近和擬合出一套最優(yōu)的戰(zhàn)術(shù)的策略。在這個意義上來說稿黍,只要人類選手的戰(zhàn)術(shù)足夠新穎疹瘦,不是AI以前碰到過的情況,人類還是有可能戰(zhàn)勝AI的巡球,這也就是為什么比賽中人類選手被禁止使用一些非常規(guī)戰(zhàn)術(shù)的原因言沐。

也就是說,第三個階段酣栈,目前AI是照著棋譜下棋险胰,通過微操作上的優(yōu)勢,和不受情感狀態(tài)的波動穩(wěn)定發(fā)揮來戰(zhàn)勝人類選手的矿筝。而第二個階段的AI則是完全做到心中無譜起便,全方位的碾壓人類。所以柯潔與AlphaGo對決后窖维,才會說“它對棋的理念都在改變我們對棋的最初想法榆综,沒有什么棋是不可以下的。在棋局中陈辱,可以大膽創(chuàng)新奖年,大膽開拓自己的思維∨嫣埃”

回到文章的提綱上來,換句話,在第三階段利赋,AI目前對人類還沒有完全形成有效超越水评。而一旦AI在這個階段形成突破,除了站在世界頂端定義規(guī)則和邊界的一小部分人媚送,對大部分人來說中燥,生存條件將會變得前所未有的惡劣,從馬斯洛需求模型來看塘偎,這些人將沒有任何實(shí)現(xiàn)自己價值的途徑疗涉。也許向外太空殖民擴(kuò)張是唯一能解決這個問題的方法。

對了吟秩,再多說一句咱扣,如果用游戲來測試AI的水平的話,我覺得魔獸爭霸比星際更有說服力涵防!

第四階段

k闹伪,b,α壮池、β偏瓤、δ。椰憋。厅克。都未知,而且α橙依、β已骇、δ。票编。褪储。取值不固定,x約束條件未知需要自己求解慧域,求最優(yōu)解y鲤竹。(我勒個擦,再吐槽一次昔榴,公眾號公式弄不了下標(biāo)辛藻,只能截圖,不美觀盎ザV )

這個階段就牛逼了,簡單來說就是什么都不知道仰禽,也沒有任何規(guī)則和邊界的約束氮墨,自己去找約束條件纺蛆,只對結(jié)果有要求。未有效突破第三階段之前规揪,這個階段AI肯定無法染指桥氏。

差不多該收尾了,AI已經(jīng)成功突破了第一和第二階段猛铅,第三階段以發(fā)展的眼光來看隨著量子計(jì)算和回歸算法的迭代優(yōu)化字支,突破只是時間問題。而對于人類來說奸忽,第三階段的突破堕伪,將會導(dǎo)致很多人失去工作價值,這個階段栗菜,要面臨的不光是技術(shù)問題還有社會問題和倫理問題欠雌,這個時候AI還是人類的幫手和工具的延伸,對于人類來說怎么解決被AI淘汰掉工作機(jī)會的人的安置問題苛萎,處理人類內(nèi)部矛盾將是一個最大的難題桨昙,這個階段人類社會可能會出現(xiàn)重大變革,有可能進(jìn)步也有可能倒退腌歉。如果最終的結(jié)果是AI進(jìn)入第四階段蛙酪,那么人類將會碰到與AI的領(lǐng)導(dǎo)權(quán)之爭,所有的知識體系和價值觀將會顛覆翘盖,整個世界從底層開始重新架構(gòu)桂塞。。馍驯。

-----------------------------------------

最后附上兩個MaNa對戰(zhàn)AlphaStar的視頻:

視頻一阁危,AlphaStar 5:0橫掃 MaNa



Deepmind AI AlphaStar vs MaNa_騰訊視頻

視頻二,MaNa公開賽戰(zhàn)勝AlphaStar



AlphaStar對MaNa直播局_星際爭霸2_騰訊視頻
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末汰瘫,一起剝皮案震驚了整個濱河市狂打,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌混弥,老刑警劉巖趴乡,帶你破解...
    沈念sama閱讀 206,968評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異蝗拿,居然都是意外死亡晾捏,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,601評論 2 382
  • 文/潘曉璐 我一進(jìn)店門哀托,熙熙樓的掌柜王于貴愁眉苦臉地迎上來惦辛,“玉大人,你說我怎么就攤上這事仓手∨制耄” “怎么了玻淑?”我有些...
    開封第一講書人閱讀 153,220評論 0 344
  • 文/不壞的土叔 我叫張陵,是天一觀的道長市怎。 經(jīng)常有香客問我岁忘,道長辛慰,這世上最難降的妖魔是什么区匠? 我笑而不...
    開封第一講書人閱讀 55,416評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮帅腌,結(jié)果婚禮上驰弄,老公的妹妹穿的比我還像新娘。我一直安慰自己速客,他們只是感情好戚篙,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,425評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著溺职,像睡著了一般岔擂。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上浪耘,一...
    開封第一講書人閱讀 49,144評論 1 285
  • 那天乱灵,我揣著相機(jī)與錄音,去河邊找鬼七冲。 笑死痛倚,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的澜躺。 我是一名探鬼主播蝉稳,決...
    沈念sama閱讀 38,432評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼掘鄙!你這毒婦竟也來了耘戚?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,088評論 0 261
  • 序言:老撾萬榮一對情侶失蹤操漠,失蹤者是張志新(化名)和其女友劉穎收津,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體颅夺,經(jīng)...
    沈念sama閱讀 43,586評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡朋截,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,028評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了吧黄。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片部服。...
    茶點(diǎn)故事閱讀 38,137評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖拗慨,靈堂內(nèi)的尸體忽然破棺而出廓八,到底是詐尸還是另有隱情奉芦,我是刑警寧澤,帶...
    沈念sama閱讀 33,783評論 4 324
  • 正文 年R本政府宣布剧蹂,位于F島的核電站声功,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏宠叼。R本人自食惡果不足惜先巴,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,343評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望冒冬。 院中可真熱鬧伸蚯,春花似錦、人聲如沸简烤。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,333評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽横侦。三九已至挥萌,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間枉侧,已是汗流浹背引瀑。 一陣腳步聲響...
    開封第一講書人閱讀 31,559評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留棵逊,地道東北人伤疙。 一個月前我還...
    沈念sama閱讀 45,595評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像辆影,于是被迫代替她去往敵國和親徒像。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,901評論 2 345

推薦閱讀更多精彩內(nèi)容