這次是德州撲克被人工智能攻陷，下次敗給AI的會是什么

據媒體報道垦细，與當地時間1月30日择镇，在賓夕法尼亞州匹茲堡的Rivers賭場，卡耐基梅隆大學（CMU）開發(fā)的人工智能系統(tǒng)Libratus戰(zhàn)勝四位德州撲克頂級選手括改，獲得最終勝利腻豌。根據官網介紹，此次由4名人類職業(yè)玩家Jason Les嘱能、Dong Kim吝梅、Daniel McAulay和Jimmy Chou對戰(zhàn)人工智能程序Libratus，賽程為20天惹骂，共進行了12萬手牌苏携。

比賽過程中，人類選手整體上從未領先過对粪。進入比賽最后一天時右冻，Libratus 贏得156 萬籌碼。人類選手要挽回劣勢著拭，只有不到 5,000 手的機會纱扭。Jason Les 說，最后的感覺就是茫死，自己所能做的就是輸跪但。這太打擊士氣了履羞。

在這場德?lián)漕I域的人機巔峰對決中峦萎，人類可謂是慘敗屡久。在共計20個比賽日中，人類團隊只在其中4天里贏得了籌碼爱榔。

1月30日傍晚被环，完成了3萬手比賽的Jimmy Chou筋疲力盡地告訴媒體，“這太難了详幽。它（Libratus）不僅不留空子給我鉆筛欢，而且我真的覺得它在鉆我空子”。

Daniel McAulay說道唇聘，“在第10比賽日的時候版姑，我還樂觀心很大，想把那AI拉下馬”迟郎。他們絞盡腦汁剥险，每天比賽后都開會到深夜，但想出的戰(zhàn)術沒一個管用的宪肖”碇疲“是啊，我們就是完敗控乾，還能說啥呢”么介。

而在四名人類高手中最終戰(zhàn)績最佳的Dong Kim或許“早已看穿了一切”，在賽程過半時蜕衡，他就認定人類已經沒有機會了壤短。

Jason Lee下場后則迫不及待地想去找Libratus的開發(fā)者們聊一聊，“我就是想確定一下他們是不是把計算機偷偷塞在我們腦子里了衷咽，因為它改變戰(zhàn)術的時候就像是針對我們每個人發(fā)動的‘人身攻擊’”鸽扁。

與 Libratus對抗中的德?lián)鋵I(yè)選手 Jason Les

早在1979 年，人類首次在西洋雙陸棋游戲（backgammon）中敗給機器镶骗。1997 年桶现，Gary Kasparov 輸給 IBM 的深藍。當時他評論說鼎姊，可以感覺到對手是種新的智能形式骡和。人類輸給機器的其他游戲包括：西洋棋、黑白棋相寇、拼字游戲（Scrabble）慰于，甚至是 Jeopardy! 和經典的 Pong。

而在最近唤衫，人工智能打敗頂尖圍棋高手婆赠。2016 年 3 月，李世石 4：1 惜敗 AlphaGo佳励。2016 年圣誕節(jié)期間休里，匿名再度出山的 AlphaGO也即是master?陸續(xù)擊敗中國頂尖圍棋高手蛆挫，贏得毫無懸念。

Libratus 是一個玩無限德州撲克的人工智能程序妙黍，由卡耐基梅隆大學的 Tuomas Sandholm 教授與 Noam Brown 博士所開發(fā)悴侵。Libratus 的策略并非基于專業(yè)玩家的經驗，所以它的玩牌方式可能有明顯的不同拭嫁】擅猓基于在匹茲堡超級計算機中心大約 1500 萬核心小時（core hours）的計算，它使用算法分析德?lián)湟?guī)則做粤，建立自己的策略浇借。在此次的比賽中，Libratus 將繼續(xù)提升自己的策略怕品。據介紹逮刨，創(chuàng)造 Libratus 使用的算法并非為撲克專門設計的。在面臨不完全或誤導信息時堵泽，該人工智能進行推論的能力有著廣泛的潛在應用修己，包括業(yè)務談判、醫(yī)療迎罗、網絡安全睬愤、競拍等等。

百度首席科學家吳恩達（Andrew Ng）說道纹安，“撲克是人工智能最難攻克的游戲之一尤辱。每一步沒有所謂的最優(yōu)解，人工智能要采取隨機的策略厢岂，這樣它詐唬的時候對方才會吃不準光督。”

詐唬（bluffing）是德州撲克的一種經典策略塔粒，它生動地體現(xiàn)了撲克游戲的“心理博弈”特征：即在手上的牌不夠大的時候结借，依然虛張聲勢地加注，以嚇退對手卒茬。為了達到好的詐唬效果船老，玩家的下注策略需要具備足夠的隨機性，以避免被對手摸清套路圃酵×希總是詐唬的人和從不詐唬的人都不是一個好的德?lián)渫婕摇?/p>

在本次比賽中，人類玩家明顯地感覺到Libratus善于詐唬及不被詐唬郭赐。這得益于開發(fā)者們教會它運用博弈論和戰(zhàn)略決策理論薪韩，在充滿不確定性的情景中找到平衡風險與收益的最佳策略，即所謂的“均衡”。

值得一提的是俘陷，這次比賽是以鏡像局的方式進行的张惹。在每一對鏡像局中，AI和人類玩家的手牌是對調的岭洲。這種比賽方式不僅消除了抓牌運氣的影響，也為我們了解AI的出牌風格提供了生動的視角坎匿。這比如其中一盤盾剩，人類高中Jason Lee起手牌是一對10（非梅花），前三張公共牌為K替蔬、9告私、4(其中有兩張梅花)，第四張和第五張都開出了非梅花牌承桥。此時驻粟，AI突然壓上所有籌碼，Lee選擇不跟凶异。通過隔壁的鏡像局蜀撑，我們發(fā)現(xiàn)AI當時的起手牌確實是兩張梅花，也就是剩彬，AI最后在湊同花失敗的情況下酷麦，成功通過詐唬贏下了一局。而在鏡像局中喉恋，AI早早為手上一對10下了重注沃饶，最后人類玩家同樣選擇棄牌。

據了解轻黑，曾在2015年糊肤，CMU曾組織了首場“大腦對抗人工智能”賽事。在當時的賽事中氓鄙，代表CMU出戰(zhàn)的是另外一款人工智能系統(tǒng)“Claudico”馆揉，同樣也有4名職業(yè)撲克玩家參加了比賽，然而抖拦，Claudico并未獲得最終勝利把介。

不過CMU學認為，當時撲克職業(yè)玩家與Claudico僅進行了8萬手牌的比賽蟋座，就統(tǒng)計學角度來講并無法證明人類職業(yè)撲克玩家或人工智能具有優(yōu)勢拗踢。這也是本輪巡回賽中比賽的牌局數量增加50%的原因。

一些人可能不知道德州撲克的玩法：每個玩家有2張牌作為“底牌”向臀，同時還有5張公共牌巢墅。玩家選擇5張公共牌里的3張，與手里的2張底牌組合，最后以期得到最好的5張牌的組合君纫。按照“Card Ranking”決定最后的勝者驯遇。在這種情況下，由于對方的“底牌信息”是隱藏信息蓄髓，對于計算機來說叉庐，就是在處理一種“非完整信息博弈”。而圍棋對弈雙方的信息是完整的会喝、對稱的陡叠，并沒有隱藏的信息。Libratus此次戰(zhàn)勝頂級人類德州撲克選手肢执，具有非常重要的意義枉阵。

盡管就表面來看，Libratus這次奪魁像是阿爾法狗戰(zhàn)勝李世石的翻版预茄，無非是再一次證明了人類玩游戲玩不過計算機兴溜。但事實上，解決棋類和解決撲克這兩個問題對人工智能而言耻陕，性質和路徑非常不同拙徽。

就路徑來看，我們已經發(fā)現(xiàn)相比起孕育在時髦的深度學習土壤中的阿爾法狗诗宣，Libratus或許更加像一個依賴超算能力的“經典人工智能”（Good Old-Fashioned Artificial Intelligence）斋攀。除此之外，阿爾法狗通過計算每一步的勝率來進行決策梧田，但Libratus面臨的決策情景則復雜得多淳蔼，為此，開發(fā)者不得不引入博弈論來對問題進行處理裁眯。

這也是人類在德州撲克陣地上比圍棋多撐了一會兒的原因鹉梨。此前20年間被人工智能攻克的西洋雙陸棋、跳棋穿稳、國際象棋和圍棋都是“完美信息”游戲存皂，所有玩家在游戲中能獲得的確定性信息是對稱的。人工智能掌握這些游戲的難度逢艘，主要取決于游戲中需要做出的決策點（decision points）的數量旦袋，這決定了計算機需要的計算量。圍棋是上述幾種棋類中決策點數量最多的它改，因而也是最后被人工智能掌握的疤孕。一盤圍棋游戲約包含有10的170次方個決策點。

而計算機之父馮?諾依曼說過央拖，“現(xiàn)實世界與此不同祭阀，現(xiàn)實世界包含有很多賭博鹉戚、欺騙的戰(zhàn)術，還涉及你會思考別人會認為你將做什么专控∧ǖ剩”德州撲克就是這樣一種更接近現(xiàn)實世界的“非完美信息”游戲，玩家只掌握不對稱的信息伦腐，他不知道對手手中是什么牌赢底，不知道五張公共牌會開出怎樣的結果，也不知道對手猜測自己握有怎樣的手牌柏蘑。這些問題在計算范圍之內幸冻。

因此，雖然一對一無限注德?lián)溆螒蛑邪?0的160次方個決策點辩越，要少于圍棋，但它對人工智能的推理能力提出了更高的要求信粮。

而通過博弈論讓人工智能學會找到平衡風險與收益的方法黔攒，不僅會在牌桌上贏得籌碼，也將在現(xiàn)實生活中找到用武之地强缘。這也是匹茲堡超算中心同意與桑德霍姆合作的原因督惰。畢竟商業(yè)談判、網絡安全旅掂、出租車自動駕駛赏胚、機器人規(guī)劃、醫(yī)療規(guī)劃等領域都需要在“不完美信息”情景中做出決策商虐。諾姆?布朗認為觉阅，現(xiàn)在人工智能已經在圍棋、撲克等特定任務上媲美甚至超過人類秘车，但我們最終追求的是能像人類一樣適應現(xiàn)實生活中各種不確定性和完成各種任務的通用人工智能（GAI）典勇，而Libratus就在應對不確定性這個問題上走出了關鍵一步。從這個意義上說叮趴，會玩德州撲克的AI或許比會下圍棋的AI更有用割笙。

最后編輯于：2017.12.05 10:38:11

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市眯亦，隨后出現(xiàn)的幾起案子伤溉，更是在濱河造成了極大的恐慌，老刑警劉巖妻率，帶你破解...
沈念sama閱讀 207,248評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件乱顾，死亡現(xiàn)場離奇詭異，居然都是意外死亡宫静，警方通過查閱死者的電腦和手機糯耍，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,681評論 2贊 381
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門扔字，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人温技，你說我怎么就攤上這事革为。” “怎么了舵鳞？”我有些...
開封第一講書人閱讀 153,443評論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵震檩，是天一觀的道長。經常有香客問我蜓堕，道長抛虏，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 55,475評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任套才，我火速辦了婚禮迂猴，結果婚禮上，老公的妹妹穿的比我還像新娘背伴。我一直安慰自己沸毁，他們只是感情好，可當我...
茶點故事閱讀 64,458評論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布傻寂。她就那樣靜靜地躺著息尺，像睡著了一般。火紅的嫁衣襯著肌膚如雪疾掰。梳的紋絲不亂的頭發(fā)上搂誉，一...
開封第一講書人閱讀 49,185評論 1贊 284
城市分裂傳說
那天，我揣著相機與錄音静檬，去河邊找鬼炭懊。笑死，一個胖子當著我的面吹牛拂檩，可吹牛的內容都是我干的凛虽。我是一名探鬼主播，決...
沈念sama閱讀 38,451評論 3贊 401
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼广恢，長吁一口氣：“原來是場噩夢啊……” “哼凯旋！你這毒婦竟也來了？” 一聲冷哼從身側響起钉迷，我...
開封第一講書人閱讀 37,112評論 0贊 261
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤至非，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后糠聪，有當地人在樹林里發(fā)現(xiàn)了一具尸體荒椭，經...
沈念sama閱讀 43,609評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 36,083評論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年舰蟆，在試婚紗的時候發(fā)現(xiàn)自己被綠了趣惠。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片狸棍。...
茶點故事閱讀 38,163評論 1贊 334
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖味悄，靈堂內的尸體忽然破棺而出草戈，到底是詐尸還是另有隱情，我是刑警寧澤侍瑟，帶...
沈念sama閱讀 33,803評論 4贊 323
?日本核電站爆炸內幕
正文年R本政府宣布唐片，位于F島的核電站，受9級特大地震影響涨颜，放射性物質發(fā)生泄漏费韭。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 39,357評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一庭瑰、第九天我趴在偏房一處隱蔽的房頂上張望星持。院中可真熱鬧，春花似錦弹灭、人聲如沸督暂。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,357評論 0贊 19
一樁弒父案鲤屡，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽损痰。三九已至福侈，卻和暖如春酒来，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背肪凛。一陣腳步聲響...
開封第一講書人閱讀 31,590評論 1贊 261
情欲美人皮
我被黑心中介騙來泰國打工堰汉，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人伟墙。一個月前我還...
沈念sama閱讀 45,636評論 2贊 355
代替公主和親
正文我出身青樓翘鸭，卻偏偏與公主長得像，于是被迫代替她去往敵國和親戳葵。傳聞我的和親對象是個殘疾皇子就乓，可洞房花燭夜當晚...
茶點故事閱讀 42,925評論 2贊 344

這次是德州撲克被人工智能攻陷泼掠，下次敗給AI的會是什么

這次是德州撲克被人工智能攻陷，下次敗給AI的會是什么

推薦閱讀更多精彩內容