這兩天出現(xiàn)了兩個我認(rèn)為比較重要的新聞,一是中國隊(duì)0:3負(fù)于伊朗丧凤,引發(fā)里皮暴怒,這個失敗我覺得倒沒什么步脓,不用太在意愿待,一方面是與伊朗的實(shí)力差距明顯,另一方面是里皮在亞洲杯前就明確表示不會續(xù)簽合同沪编,也就是說他肯定不會帶領(lǐng)中國隊(duì)沖擊下屆世界杯了呼盆。那么8強(qiáng)相對來說還是一個對中國來說最好的結(jié)果,如果真讓中國這次取得4強(qiáng)以上的成績蚁廓。那么访圃,對中國足球來說才是一個麻煩。為什么這么說呢相嵌,因?yàn)橥仁保凑漳壳暗拿~分配來說况脆,亞洲前四是可以保證進(jìn)入世界杯決賽圈的。如果這次亞洲杯國足打進(jìn)前四批糟,那么格了,不光會導(dǎo)致這批球員弄不清自己的斤兩,對于球迷和整個足球環(huán)境也就有了更高的期待徽鼎,這對于里皮的接任者來說盛末,無疑就是災(zāi)難,任何一場比賽出現(xiàn)問題都會導(dǎo)致傾覆的命運(yùn)否淤,這必將形成新教練對自己戰(zhàn)術(shù)體系的磨練和推行以及和選材的阻力悄但,如果連戰(zhàn)術(shù)體系都不能實(shí)戰(zhàn)演練,能取得好成績就是白日做夢吧石抡,而且國家隊(duì)這些三十好幾的大齡青年檐嚣,你真指望他們兩年之后和40歲的小將鄭智一起再次沖擊世界杯?從我的感受客觀來說啰扛,8強(qiáng)符合國足的定位和實(shí)力嚎京,我始終覺得,中國足球?qū)嵙Σ⒉幌衩襟w和大家認(rèn)為的那樣不堪隐解,但是要說具有亞洲頂尖的水準(zhǔn)鞍帝,肯定也不是。但是只要戰(zhàn)術(shù)得當(dāng)厢漩,加上一些運(yùn)氣膜眠,跳一跳岩臣,完全是可以沖擊世界杯決賽圈的溜嗜。所以,8強(qiáng)這個成績很好架谎,既能讓人腳踏實(shí)地炸宵,又對未來有希望。
另一個新聞則是昨天DeepMind出品的AlphaStar首次公開亮相對陣頂尖人類選手Liquid 戰(zhàn)隊(duì)的MaNa谷扣,AlphaStar在比賽中期被MaNa使用棱鏡空投不朽騷擾主礦經(jīng)濟(jì)時土全,陷入循環(huán)困境,兵力一直在無效運(yùn)動会涎,錯過壓制時機(jī)裹匙,最終告負(fù)。盡管是在公開賽中首戰(zhàn)失敗末秃,但是AlphaStar在之前分別與TLO和MaNa的五場比賽中概页,都是以5比0橫掃,這場比賽的失利练慕,其實(shí)更像是MaNa利用了AlphaStar的bug惰匙。毫無疑問技掏,人類和ai在微操上的差距不知道要用幾個量級來衡量。所以為了公平起見项鬼,比賽中對AlphaStar做出了apm<180的限制哑梳,而對人類選手則禁止使用一些非常規(guī)戰(zhàn)術(shù)。
從近年Alphago和AlphaStar和表現(xiàn)看來绘盟,人工智能的崛起已經(jīng)不可阻擋鸠真,我對人工智能的理解分為以下四個階段,為了舉例和理解簡單方便龄毡,我拿最簡單的一元一次線性方程來進(jìn)行說明弧哎,實(shí)際情況肯定比這個方程復(fù)雜,請不要對此太糾結(jié)稚虎。
階段一:y=kx+b撤嫩,k已知,b已知蠢终,給定x約束下序攘,求最優(yōu)解y。
這個是我們?nèi)粘6寄芘龅降那闆r寻拂,我們可以輕松的使用計(jì)算器和電腦求解程奠,這個階段AI早已經(jīng)輕松突破,這個階段甚至根本談不上AI祭钉。
階段二:y=kx+b瞄沙,k未知,b未知慌核,給定x約束下距境,求最優(yōu)解y。
這個階段垮卓,可以粗略對應(yīng)于AI在國際象棋和圍棋領(lǐng)域與人類的對戰(zhàn)垫桂,前幾年Alphago輕松戰(zhàn)勝李世石和柯潔。不說民用粟按,至少在實(shí)驗(yàn)室條件下诬滩,AI幾年前已經(jīng)突破。
階段三:
k灭将,b疼鸟,α、β庙曙、δ矢沿。稻据。蕾域。都未知,而且α馋袜、β、δ舶斧。欣鳖。。取值不固定茴厉,在給定x約束下泽台,求最優(yōu)解y。(我勒個擦矾缓,公眾號公式弄不了下標(biāo)怀酷,只能截圖啊J任拧)
這個階段對應(yīng)的就是我們看到的星際2蜕依,AlphaStar VS MaNa,AI面對的是多變量多權(quán)重開放動態(tài)性復(fù)雜求解琉雳,而且對應(yīng)于y1样眠、y2。翠肘。檐束。yi,權(quán)重α、β束倍、δ被丧。。绪妹。會不停變化甥桂,到這里就有點(diǎn)繞了,我結(jié)合實(shí)例仔細(xì)講一下喂急,玩過即時戰(zhàn)略游戲的人都知道游戲取勝是由一些目標(biāo)結(jié)合起來實(shí)現(xiàn)的格嘁,比如開局是資源的獲取笛求,這里可以當(dāng)成是y1廊移,然后是修建建筑、制造作戰(zhàn)單位探入,這里想像成y2狡孔、y3。游戲中期就是攻擊對方的建筑和單位蜂嗽,限制對方的資源采集和發(fā)展苗膝,這里是y4、y5植旧、y6辱揭、y7.最后是決戰(zhàn)离唐,殲滅對方的建筑和單位,y8问窃,y9.當(dāng)然亥鬓,還有其他等等,無法一一枚舉域庇。最終取得游戲勝利y=αy1+βy2+...嵌戈。在游戲過程中,各分項(xiàng)指標(biāo)y1听皿、y2熟呛、...、肯定都是越大越好尉姨,但是分項(xiàng)指標(biāo)對最終結(jié)果y的影響權(quán)重又是不一樣的庵朝,而且在不同的階段、時期以及根據(jù)對手的戰(zhàn)術(shù)不同還會變化又厉,這尼瑪偿短,簡直就是一堆亂麻啊馋没!而針對這種復(fù)雜的情況昔逗,DeepMind給AlphaStar設(shè)計(jì)的是完全不同于第二階段的一套算法。(下面這段是來源于DeepMind的項(xiàng)目領(lǐng)導(dǎo)者David Silver的引文)
“像 AlphaGo 和 AlphaZero 這樣的基于搜索的方法更難適應(yīng)不完美信息博弈篷朵。例如勾怒,基于搜索的德州撲克算法(比如 DeepStack 和 Libratus)通過信念狀態(tài)推測對手的手牌。與之不同的是声旺,AlphaStar 是一種無模型的強(qiáng)化學(xué)習(xí)算法笔链,可以間接地推理對手狀態(tài),即通過學(xué)習(xí)行為這一最有效擊敗對手的方法腮猖,而不是試圖給對手看到什么建模鉴扫。可以認(rèn)為澈缺,這是應(yīng)對不完整信息的一個有效方法坪创。
另一方面,不完美信息游戲沒有絕對最佳的游戲方式姐赡,而是取決于對手的行為莱预。這就是星際爭霸如此讓人著迷的原因,就像「石頭剪刀布」一樣项滑,所有決策都有優(yōu)勢劣勢依沮。這就是我們使用 AlphaStar 聯(lián)賽,以及為什么策略空間的所有角落都如此重要的原因——在圍棋這樣的游戲里這是不重要的,掌握了最優(yōu)策略就可以擊敗所有對手危喉∷斡妫”
從這里可以看見,針對于第二階段圍棋那樣的應(yīng)用場景AlphaGo是通過建模辜限,使用深度學(xué)習(xí)加蒙特卡洛的剪枝和搜索傻谁,量化確定最優(yōu)解。也就是說在第二個階段適用的場景下列粪,因?yàn)橐?guī)則和邊界簡單清晰审磁,AI找到最優(yōu)算法后,幾乎可以窮盡變化岂座,人類是不可能戰(zhàn)勝AI的态蒂,這也就是為什么AlphaGo在戰(zhàn)勝排名第一的柯潔之后,DeepMind不再進(jìn)行后續(xù)研發(fā)和投入的原因费什。
而在第三階段則不同钾恢,由于所面對的環(huán)境和條件更復(fù)雜,沒有辦法找到通用性的算法鸳址,AI這是通過學(xué)習(xí)和積累人類和Alpha自己對戰(zhàn)的總結(jié)和積累瘩蚪,無限逼近和擬合出一套最優(yōu)的戰(zhàn)術(shù)的策略。在這個意義上來說稿黍,只要人類選手的戰(zhàn)術(shù)足夠新穎疹瘦,不是AI以前碰到過的情況,人類還是有可能戰(zhàn)勝AI的巡球,這也就是為什么比賽中人類選手被禁止使用一些非常規(guī)戰(zhàn)術(shù)的原因言沐。
也就是說,第三個階段酣栈,目前AI是照著棋譜下棋险胰,通過微操作上的優(yōu)勢,和不受情感狀態(tài)的波動穩(wěn)定發(fā)揮來戰(zhàn)勝人類選手的矿筝。而第二個階段的AI則是完全做到心中無譜起便,全方位的碾壓人類。所以柯潔與AlphaGo對決后窖维,才會說“它對棋的理念都在改變我們對棋的最初想法榆综,沒有什么棋是不可以下的。在棋局中陈辱,可以大膽創(chuàng)新奖年,大膽開拓自己的思維∨嫣埃”
回到文章的提綱上來,換句話,在第三階段利赋,AI目前對人類還沒有完全形成有效超越水评。而一旦AI在這個階段形成突破,除了站在世界頂端定義規(guī)則和邊界的一小部分人媚送,對大部分人來說中燥,生存條件將會變得前所未有的惡劣,從馬斯洛需求模型來看塘偎,這些人將沒有任何實(shí)現(xiàn)自己價值的途徑疗涉。也許向外太空殖民擴(kuò)張是唯一能解決這個問題的方法。
對了吟秩,再多說一句咱扣,如果用游戲來測試AI的水平的話,我覺得魔獸爭霸比星際更有說服力涵防!
第四階段
k闹伪,b,α壮池、β偏瓤、δ。椰憋。厅克。都未知,而且α橙依、β已骇、δ。票编。褪储。取值不固定,x約束條件未知需要自己求解慧域,求最優(yōu)解y鲤竹。(我勒個擦,再吐槽一次昔榴,公眾號公式弄不了下標(biāo)辛藻,只能截圖,不美觀盎ザV )
這個階段就牛逼了,簡單來說就是什么都不知道仰禽,也沒有任何規(guī)則和邊界的約束氮墨,自己去找約束條件纺蛆,只對結(jié)果有要求。未有效突破第三階段之前规揪,這個階段AI肯定無法染指桥氏。
差不多該收尾了,AI已經(jīng)成功突破了第一和第二階段猛铅,第三階段以發(fā)展的眼光來看隨著量子計(jì)算和回歸算法的迭代優(yōu)化字支,突破只是時間問題。而對于人類來說奸忽,第三階段的突破堕伪,將會導(dǎo)致很多人失去工作價值,這個階段栗菜,要面臨的不光是技術(shù)問題還有社會問題和倫理問題欠雌,這個時候AI還是人類的幫手和工具的延伸,對于人類來說怎么解決被AI淘汰掉工作機(jī)會的人的安置問題苛萎,處理人類內(nèi)部矛盾將是一個最大的難題桨昙,這個階段人類社會可能會出現(xiàn)重大變革,有可能進(jìn)步也有可能倒退腌歉。如果最終的結(jié)果是AI進(jìn)入第四階段蛙酪,那么人類將會碰到與AI的領(lǐng)導(dǎo)權(quán)之爭,所有的知識體系和價值觀將會顛覆翘盖,整個世界從底層開始重新架構(gòu)桂塞。。馍驯。
-----------------------------------------
最后附上兩個MaNa對戰(zhàn)AlphaStar的視頻:
視頻一阁危,AlphaStar 5:0橫掃 MaNa
視頻二,MaNa公開賽戰(zhàn)勝AlphaStar