AlphaStar來了

這兩天出現(xiàn)了兩個我認(rèn)為比較重要的新聞，一是中國隊(duì)0：3負(fù)于伊朗丧凤，引發(fā)里皮暴怒，這個失敗我覺得倒沒什么步脓，不用太在意愿待，一方面是與伊朗的實(shí)力差距明顯，另一方面是里皮在亞洲杯前就明確表示不會續(xù)簽合同沪编，也就是說他肯定不會帶領(lǐng)中國隊(duì)沖擊下屆世界杯了呼盆。那么8強(qiáng)相對來說還是一個對中國來說最好的結(jié)果，如果真讓中國這次取得4強(qiáng)以上的成績蚁廓。那么访圃，對中國足球來說才是一個麻煩。為什么這么說呢相嵌，因?yàn)橥仁保凑漳壳暗拿~分配來說况脆，亞洲前四是可以保證進(jìn)入世界杯決賽圈的。如果這次亞洲杯國足打進(jìn)前四批糟，那么格了，不光會導(dǎo)致這批球員弄不清自己的斤兩，對于球迷和整個足球環(huán)境也就有了更高的期待徽鼎，這對于里皮的接任者來說盛末，無疑就是災(zāi)難，任何一場比賽出現(xiàn)問題都會導(dǎo)致傾覆的命運(yùn)否淤，這必將形成新教練對自己戰(zhàn)術(shù)體系的磨練和推行以及和選材的阻力悄但，如果連戰(zhàn)術(shù)體系都不能實(shí)戰(zhàn)演練，能取得好成績就是白日做夢吧石抡，而且國家隊(duì)這些三十好幾的大齡青年檐嚣，你真指望他們兩年之后和40歲的小將鄭智一起再次沖擊世界杯？從我的感受客觀來說啰扛，8強(qiáng)符合國足的定位和實(shí)力嚎京，我始終覺得，中國足球?qū)嵙Σ⒉幌衩襟w和大家認(rèn)為的那樣不堪隐解，但是要說具有亞洲頂尖的水準(zhǔn)鞍帝，肯定也不是。但是只要戰(zhàn)術(shù)得當(dāng)厢漩，加上一些運(yùn)氣膜眠，跳一跳岩臣，完全是可以沖擊世界杯決賽圈的溜嗜。所以，8強(qiáng)這個成績很好架谎，既能讓人腳踏實(shí)地炸宵，又對未來有希望。

另一個新聞則是昨天DeepMind出品的AlphaStar首次公開亮相對陣頂尖人類選手Liquid 戰(zhàn)隊(duì)的MaNa谷扣，AlphaStar在比賽中期被MaNa使用棱鏡空投不朽騷擾主礦經(jīng)濟(jì)時土全，陷入循環(huán)困境，兵力一直在無效運(yùn)動会涎，錯過壓制時機(jī)裹匙，最終告負(fù)。盡管是在公開賽中首戰(zhàn)失敗末秃，但是AlphaStar在之前分別與TLO和MaNa的五場比賽中概页，都是以5比0橫掃，這場比賽的失利练慕，其實(shí)更像是MaNa利用了AlphaStar的bug惰匙。毫無疑問技掏，人類和ai在微操上的差距不知道要用幾個量級來衡量。所以為了公平起見项鬼，比賽中對AlphaStar做出了apm<180的限制哑梳，而對人類選手則禁止使用一些非常規(guī)戰(zhàn)術(shù)。

從近年Alphago和AlphaStar和表現(xiàn)看來绘盟，人工智能的崛起已經(jīng)不可阻擋鸠真，我對人工智能的理解分為以下四個階段，為了舉例和理解簡單方便龄毡，我拿最簡單的一元一次線性方程來進(jìn)行說明弧哎，實(shí)際情況肯定比這個方程復(fù)雜，請不要對此太糾結(jié)稚虎。

階段一：y=kx+b撤嫩，k已知，b已知蠢终，給定x約束下序攘，求最優(yōu)解y。

這個是我們?nèi)粘６寄芘龅降那闆r寻拂，我們可以輕松的使用計(jì)算器和電腦求解程奠，這個階段AI早已經(jīng)輕松突破，這個階段甚至根本談不上AI祭钉。

階段二：y=kx+b瞄沙，k未知，b未知慌核，給定x約束下距境，求最優(yōu)解y。

這個階段垮卓，可以粗略對應(yīng)于AI在國際象棋和圍棋領(lǐng)域與人類的對戰(zhàn)垫桂，前幾年Alphago輕松戰(zhàn)勝李世石和柯潔。不說民用粟按，至少在實(shí)驗(yàn)室條件下诬滩，AI幾年前已經(jīng)突破。

階段三：

k灭将，b疼鸟，α、β庙曙、δ矢沿。稻据。蕾域。都未知，而且α馋袜、β、δ舶斧。欣鳖。。取值不固定茴厉，在給定x約束下泽台，求最優(yōu)解y。（我勒個擦矾缓，公眾號公式弄不了下標(biāo)怀酷，只能截圖啊Ｊ任拧）

這個階段對應(yīng)的就是我們看到的星際2蜕依，AlphaStar VS MaNa，AI面對的是多變量多權(quán)重開放動態(tài)性復(fù)雜求解琉雳，而且對應(yīng)于y1样眠、y2。翠肘。檐束。yi,權(quán)重α、β束倍、δ被丧。。绪妹。會不停變化甥桂，到這里就有點(diǎn)繞了，我結(jié)合實(shí)例仔細(xì)講一下喂急，玩過即時戰(zhàn)略游戲的人都知道游戲取勝是由一些目標(biāo)結(jié)合起來實(shí)現(xiàn)的格嘁，比如開局是資源的獲取笛求，這里可以當(dāng)成是y1廊移，然后是修建建筑、制造作戰(zhàn)單位探入，這里想像成y2狡孔、y3。游戲中期就是攻擊對方的建筑和單位蜂嗽，限制對方的資源采集和發(fā)展苗膝，這里是y4、y5植旧、y6辱揭、y7.最后是決戰(zhàn)离唐，殲滅對方的建筑和單位，y8问窃，y9.當(dāng)然亥鬓，還有其他等等，無法一一枚舉域庇。最終取得游戲勝利y=αy1+βy2+...嵌戈。在游戲過程中，各分項(xiàng)指標(biāo)y1听皿、y2熟呛、...、肯定都是越大越好尉姨，但是分項(xiàng)指標(biāo)對最終結(jié)果y的影響權(quán)重又是不一樣的庵朝，而且在不同的階段、時期以及根據(jù)對手的戰(zhàn)術(shù)不同還會變化又厉，這尼瑪偿短，簡直就是一堆亂麻啊馋没！而針對這種復(fù)雜的情況昔逗，DeepMind給AlphaStar設(shè)計(jì)的是完全不同于第二階段的一套算法。（下面這段是來源于DeepMind的項(xiàng)目領(lǐng)導(dǎo)者David Silver的引文）

“像 AlphaGo 和 AlphaZero 這樣的基于搜索的方法更難適應(yīng)不完美信息博弈篷朵。例如勾怒，基于搜索的德州撲克算法（比如 DeepStack 和 Libratus）通過信念狀態(tài)推測對手的手牌。與之不同的是声旺，AlphaStar 是一種無模型的強(qiáng)化學(xué)習(xí)算法笔链，可以間接地推理對手狀態(tài)，即通過學(xué)習(xí)行為這一最有效擊敗對手的方法腮猖，而不是試圖給對手看到什么建模鉴扫。可以認(rèn)為澈缺，這是應(yīng)對不完整信息的一個有效方法坪创。

另一方面，不完美信息游戲沒有絕對最佳的游戲方式姐赡，而是取決于對手的行為莱预。這就是星際爭霸如此讓人著迷的原因，就像「石頭剪刀布」一樣项滑，所有決策都有優(yōu)勢劣勢依沮。這就是我們使用 AlphaStar 聯(lián)賽，以及為什么策略空間的所有角落都如此重要的原因——在圍棋這樣的游戲里這是不重要的，掌握了最優(yōu)策略就可以擊敗所有對手危喉∷斡妫”

從這里可以看見，針對于第二階段圍棋那樣的應(yīng)用場景AlphaGo是通過建模辜限，使用深度學(xué)習(xí)加蒙特卡洛的剪枝和搜索傻谁，量化確定最優(yōu)解。也就是說在第二個階段適用的場景下列粪，因?yàn)橐?guī)則和邊界簡單清晰审磁，AI找到最優(yōu)算法后，幾乎可以窮盡變化岂座，人類是不可能戰(zhàn)勝AI的态蒂，這也就是為什么AlphaGo在戰(zhàn)勝排名第一的柯潔之后，DeepMind不再進(jìn)行后續(xù)研發(fā)和投入的原因费什。

而在第三階段則不同钾恢，由于所面對的環(huán)境和條件更復(fù)雜，沒有辦法找到通用性的算法鸳址，AI這是通過學(xué)習(xí)和積累人類和Alpha自己對戰(zhàn)的總結(jié)和積累瘩蚪，無限逼近和擬合出一套最優(yōu)的戰(zhàn)術(shù)的策略。在這個意義上來說稿黍，只要人類選手的戰(zhàn)術(shù)足夠新穎疹瘦，不是AI以前碰到過的情況，人類還是有可能戰(zhàn)勝AI的巡球，這也就是為什么比賽中人類選手被禁止使用一些非常規(guī)戰(zhàn)術(shù)的原因言沐。

也就是說，第三個階段酣栈，目前AI是照著棋譜下棋险胰，通過微操作上的優(yōu)勢，和不受情感狀態(tài)的波動穩(wěn)定發(fā)揮來戰(zhàn)勝人類選手的矿筝。而第二個階段的AI則是完全做到心中無譜起便，全方位的碾壓人類。所以柯潔與AlphaGo對決后窖维，才會說“它對棋的理念都在改變我們對棋的最初想法榆综，沒有什么棋是不可以下的。在棋局中陈辱，可以大膽創(chuàng)新奖年，大膽開拓自己的思維∨嫣埃”

回到文章的提綱上來，換句話，在第三階段利赋，AI目前對人類還沒有完全形成有效超越水评。而一旦AI在這個階段形成突破，除了站在世界頂端定義規(guī)則和邊界的一小部分人媚送，對大部分人來說中燥，生存條件將會變得前所未有的惡劣，從馬斯洛需求模型來看塘偎，這些人將沒有任何實(shí)現(xiàn)自己價值的途徑疗涉。也許向外太空殖民擴(kuò)張是唯一能解決這個問題的方法。

對了吟秩，再多說一句咱扣，如果用游戲來測試AI的水平的話，我覺得魔獸爭霸比星際更有說服力涵防！

第四階段

k闹伪，b，α壮池、β偏瓤、δ。椰憋。厅克。都未知，而且α橙依、β已骇、δ。票编。褪储。取值不固定，x約束條件未知需要自己求解慧域，求最優(yōu)解y鲤竹。（我勒個擦，再吐槽一次昔榴，公眾號公式弄不了下標(biāo)辛藻，只能截圖，不美觀盎ザＶ　）

這個階段就牛逼了，簡單來說就是什么都不知道仰禽，也沒有任何規(guī)則和邊界的約束氮墨，自己去找約束條件纺蛆，只對結(jié)果有要求。未有效突破第三階段之前规揪，這個階段AI肯定無法染指桥氏。

差不多該收尾了，AI已經(jīng)成功突破了第一和第二階段猛铅，第三階段以發(fā)展的眼光來看隨著量子計(jì)算和回歸算法的迭代優(yōu)化字支，突破只是時間問題。而對于人類來說奸忽，第三階段的突破堕伪，將會導(dǎo)致很多人失去工作價值，這個階段栗菜，要面臨的不光是技術(shù)問題還有社會問題和倫理問題欠雌，這個時候AI還是人類的幫手和工具的延伸，對于人類來說怎么解決被AI淘汰掉工作機(jī)會的人的安置問題苛萎，處理人類內(nèi)部矛盾將是一個最大的難題桨昙，這個階段人類社會可能會出現(xiàn)重大變革，有可能進(jìn)步也有可能倒退腌歉。如果最終的結(jié)果是AI進(jìn)入第四階段蛙酪，那么人類將會碰到與AI的領(lǐng)導(dǎo)權(quán)之爭，所有的知識體系和價值觀將會顛覆翘盖，整個世界從底層開始重新架構(gòu)桂塞。。馍驯。

-----------------------------------------

最后附上兩個MaNa對戰(zhàn)AlphaStar的視頻：

視頻一阁危，AlphaStar 5：0橫掃 MaNa

Deepmind AI AlphaStar vs MaNa_騰訊視頻

視頻二，MaNa公開賽戰(zhàn)勝AlphaStar

AlphaStar對MaNa直播局_星際爭霸2_騰訊視頻

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末汰瘫，一起剝皮案震驚了整個濱河市狂打，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌混弥，老刑警劉巖趴乡，帶你破解...
沈念sama閱讀 206,968評論 6贊 482
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異蝗拿，居然都是意外死亡晾捏，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,601評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門哀托，熙熙樓的掌柜王于貴愁眉苦臉地迎上來惦辛，“玉大人，你說我怎么就攤上這事仓手∨制耄” “怎么了玻淑？”我有些...
開封第一講書人閱讀 153,220評論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長市怎。經(jīng)常有香客問我岁忘，道長辛慰，這世上最難降的妖魔是什么区匠？我笑而不...
開封第一講書人閱讀 55,416評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮帅腌，結(jié)果婚禮上驰弄，老公的妹妹穿的比我還像新娘。我一直安慰自己速客，他們只是感情好戚篙，可當(dāng)我...
茶點(diǎn)故事閱讀 64,425評論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著溺职，像睡著了一般岔擂。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上浪耘，一...
開封第一講書人閱讀 49,144評論 1贊 285
城市分裂傳說
那天乱灵，我揣著相機(jī)與錄音，去河邊找鬼七冲。笑死痛倚，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的澜躺。我是一名探鬼主播蝉稳，決...
沈念sama閱讀 38,432評論 3贊 401
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼掘鄙！你這毒婦竟也來了耘戚？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 37,088評論 0贊 261
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤操漠，失蹤者是張志新（化名）和其女友劉穎收津，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體颅夺，經(jīng)...
沈念sama閱讀 43,586評論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡朋截，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,028評論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了吧黄。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片部服。...
茶點(diǎn)故事閱讀 38,137評論 1贊 334
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖拗慨，靈堂內(nèi)的尸體忽然破棺而出廓八，到底是詐尸還是另有隱情奉芦，我是刑警寧澤，帶...
沈念sama閱讀 33,783評論 4贊 324
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布剧蹂，位于F島的核電站声功，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏宠叼。R本人自食惡果不足惜先巴，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,343評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望冒冬。院中可真熱鬧伸蚯，春花似錦、人聲如沸简烤。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,333評論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽横侦。三九已至挥萌，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間枉侧，已是汗流浹背引瀑。一陣腳步聲響...
開封第一講書人閱讀 31,559評論 1贊 262
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留棵逊，地道東北人伤疙。一個月前我還...
沈念sama閱讀 45,595評論 2贊 355
代替公主和親
正文我出身青樓，卻偏偏與公主長得像辆影，于是被迫代替她去往敵國和親徒像。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,901評論 2贊 345

AlphaStar來了

推薦閱讀更多精彩內(nèi)容