關于零和博弈净响,來說說幾個經典案例少欺!
一、囚徒困境
這個帕累托改進辦不到馋贤,因為它不能滿足人類的理性要求赞别。囚徒困境所反映出的深刻問題是,人類的個人理性有時能導致集體的非理性——聰明的人類會因自己的聰明而作繭自縛配乓。
二仿滔、旅行者困境
兩個旅行者從一個以出產細瓷花瓶著稱的地方旅行回來惠毁,他們都買了花瓶。提取行李的時候堤撵,發(fā)現(xiàn)花瓶被摔壞了仁讨,于是他們向航空公司索賠。航空公司知道花瓶的價格大概在八九十元的價位浮動实昨,但是不知道兩位旅客買的時候的確切價格是多少洞豁。于是,航空公司請兩位旅客在100元以內自己寫下花瓶的價格荒给。如果兩人寫的一樣丈挟,航空公司將認為他們講真話,就按照他們寫的數額賠償志电;如果兩人寫的不一樣曙咽,航空公司就認定寫得低的旅客講的是真話,并且原則上按這個低的價格賠償挑辆,同時例朱,航空公司對講真話的旅客獎勵2元,對講假話的旅客罰款2元鱼蝉。
為了獲取最大賠償而言洒嗤,本來甲乙雙方最好的策略,就是都寫100元魁亦,這樣兩人都能夠獲賠100元渔隶。可是不洁奈,甲很聰明间唉,他想:如果我少寫1元變成99元,而乙會寫100元利术,這樣我將得到101元呈野。何樂而不為?所以他準備寫99元印叁〖使颍可是乙更聰明,他算計到甲要算計他寫99元喉钢,于是他準備寫98元。想不到甲還要更聰明一個層次良姆,估計到乙要寫98元來坑他肠虽,于是他準備寫97
下象棋的時候,“看”得越遠玛追,勝算越大税课。 在花瓶索賠的例子中闲延,如果兩個人都“徹底理性”,都能看透十幾步甚至幾十步上百步韩玩,那么上面那樣“精明比賽”的結果垒玲,最后落到每個人都只寫一兩元的地步。事實上找颓,在徹底理性的假設之下合愈,這個博弈唯一的納什均衡,是兩人都寫0击狮。
三佛析、是競爭也是劫持
費城西區(qū)有兩個互為敵手的商店—紐約廉價品商店和美國廉價品商店.他們正好緊挨著, 兩店的老板是死敵, 他們一直進行著沒完沒了的價格戰(zhàn).出售愛爾蘭亞麻床單,;而這床單的價格又低得可笑, 只需6美元50美分".當一個店的櫥窗里出現(xiàn)這樣的手寫告示時每位顧客都會習慣地等另一家廉價品商店的回音.果然, 大約過了兩小時, 另一家商店的櫥窗里出現(xiàn)了這樣的告示: "我的床單質量一流, 只需5美元95美分".價格大戰(zhàn)的一天就這樣開始了.除了貼告示以外, 兩店的老板還經常站在店外尖聲對罵, 經常發(fā)展到拳腳相加, 最后總有一方的老板在這場價格戰(zhàn)中停止爭斗, 價格不再下降.罵那個人是瘋子, 這就意味著那方勝利了.這時, 圍觀的彪蓬、路過的寸莫、還有附近每一個人都會擁入獲勝的廉價品商店, 將床單和其他物品搶購一空.在這個地區(qū), 這兩個店的爭吵是最激烈的, 也是持續(xù)時間最長的, 因此竟很有名聲, 住在附近的每個人都從他們的爭斗中獲益不少, 買到了各式各樣的"精美"商品.突然有一天, 一個店的老板死了, 幾天以后, 另一個店的老板聲稱去外地辦貨, 這兩家商店都停業(yè)了.過了幾個星期, 兩個商店分別來了新老板.他們各自對兩個商店前任老板的財產進行了詳細的調查.一天檢查時, 他們發(fā)現(xiàn)兩店之間有條秘密通道, 并且在兩商店的樓上兩老板住過的套房里發(fā)現(xiàn)了一扇連接兩套房子的門.新老板很奇怪, 后來一了解才知道, 這兩個死對頭竟是兄弟倆.原來, 所有的詛咒、謾罵档冬、威脅以及一切相互間的人身攻擊全是在演戲, 每場價格戰(zhàn)都是裝出來的, 不管誰戰(zhàn)勝誰, 最后還是把另一位的一切庫存商品與自己的一起賣給顧客.真是絕妙的騙局膘茎。
四、酒吧博弈問題
該博弈是說:有一群人酷誓,例如n=100披坏,每個周末,均要決定是去一酒吧活動還是呆在家里呛牲。酒吧的容量是有限的刮萌,假定是60人。如果某人預測去酒吧的人超過60人娘扩,那么他決定去還是不去着茸?
每個參與者或決策者面臨的信息只是以前去酒吧的人數,只能根據以前的人數的信息來歸納出策略來琐旁。這是一個典型的動態(tài)博弈問題涮阔。
通過計算機的模型實驗,不同的行動者是根據自己的歸納來行動的灰殴,并且敬特,去酒吧的人數沒有一個固定的規(guī)律,然而牺陶,經過一段時間以后伟阔,去的平均人數總是趨于60。阿瑟說掰伸,預測者自組織到一個均衡系統(tǒng)中去和不去的人群皱炉,或形成一個生態(tài)穩(wěn)定系統(tǒng)。這就是酒吧問題狮鸭。
酒吧問題所反映的是這樣一個社會現(xiàn)象合搅,正象阿瑟教授說的那樣多搀,我們在許多行動中,要猜測別人的行動灾部,然而我們沒有更多關于他人的信息康铭,我們只有通過分析過去的歷史來預測未來。
五赌髓、槍手博弈
彼此痛恨的甲从藤、乙、丙三個槍手準備決斗春弥。甲槍法最好呛哟,十發(fā)八中;乙槍法次之匿沛,十發(fā)六中扫责;丙槍法最差,十發(fā)四中逃呼。
先提第一個問題:如果三人同時開槍鳖孤,并且每人只發(fā)一槍;第一輪槍戰(zhàn)后抡笼,誰活下來的機會大一些苏揣?
一般人認為甲的槍法好,活下來的可能性大一些推姻。但合乎推理的結論是平匈,槍法最糟糕的丙活下來的幾率最大。
我們來分析一下各個槍手的策略藏古。
槍手甲一定要對槍手乙先開槍增炭。因為乙對甲的威脅要比丙對甲的威脅更大,甲應該首先干掉乙拧晕,這是甲的最佳策略隙姿。
同樣的道理,槍手乙的最佳策略是第一槍瞄準甲厂捞。乙一旦將甲干掉输玷,乙和丙進行對決,乙勝算的概率自然大很多靡馁。
槍手丙的最佳策略也是先對甲開槍欲鹏。乙的槍法畢竟比甲差一些,丙先把甲干掉再與乙進行對決臭墨,丙的存活概率還是要高一些貌虾。
我們計算一下三個槍手在上述情況下的存活幾率:
甲:24%(被乙丙合射40% X 60% = 24%)
乙:20%(被甲射100% - 80% = 20%)
丙:100%(無人射丙)
通過概率分析,我們發(fā)現(xiàn)槍法最差的丙存活的幾率最大裙犹,槍法好于丙的甲和乙的存活幾率遠低于丙的存活幾率尽狠。
但是,上面的例子隱含一個假定叶圃,那就是甲乙丙三人都清楚地了解對手打槍的命中率袄膏。但現(xiàn)實生活中,因為信息不對稱掺冠,比如槍手甲偽裝自己沉馆,讓槍手乙和丙認為甲的槍法最差,在這種情況下德崭,最終的幸存者一定是甲斥黑。所以,無論是歷史眉厨,還是現(xiàn)實锌奴,那些城府很深的奸雄往往能成為最后的勝利者。
我們繼續(xù)假定憾股,甲乙丙三人互相不了解對手的槍法水平鹿蜀。在這種情況下,甲被乙射服球、甲被丙射茴恰、甲被乙丙射及甲不被乙丙射的機率各為25%,按貝氏(Bayes)定理計算甲的存活率:
甲活率:31%([被乙射:25% X 40% = 10%] + [被丙射:25% X 60% = 15%] + [被乙丙射:25% X 40% X 60% = 6%])斩熊。
乙活率:23%([被甲射:25% X 20% = 5%] + [被丙射:25% X 60% = 15%] + [被甲丙射:25%X20%X60% = 3%])往枣。
丙活率:17%([被甲射:25% X 20% = 5%] + [被乙射:25% X 40% = 10%] + [被甲乙射:25% X 20% X 40% = 2%])。
在槍手互相不知道對手命中率的信息的情況下粉渠,這時命中率最高的槍手甲存活的幾率最大分冈,槍法最差的丙存活的可能性最小。
我們現(xiàn)在回到甲乙丙都知道對手命中率的情形渣叛,進行第二輪槍戰(zhàn)的分析丈秩。
在第一輪槍戰(zhàn)后,丙有可能面對甲淳衙,也可能面對乙蘑秽,甚至同時面對甲與乙,除非第一輪中甲乙皆死箫攀。盡管第一輪結束后肠牲,丙極有可能獲勝(即甲乙雙亡),但是第二輪開始靴跛,丙就一定處于劣勢缀雳,因為不論甲或乙,他們的命中率都比丙的命中率為高梢睛。
這就是槍手丙的悲哀肥印。能力不行的丙玩些花樣雖然能在第一輪槍戰(zhàn)中暫時獲勝识椰。但是,如果甲乙在第一輪槍戰(zhàn)中沒有雙亡的話深碱,在第二輪槍戰(zhàn)結束后腹鹉,丙的存活的幾率就一定比甲或乙為低。
第二輪槍戰(zhàn)中甲乙丙存活的幾率粗算如下:
(1) 假設甲丙對決:甲的存活率為60%敷硅,丙的存活率為20%功咒。
(2) 假設乙丙對決:乙的存活率為60%,丙的存活率為40%绞蹦。
這似乎說明力奋,能力差的人在競爭中耍弄手腕能贏一時,但最終往往不能成事幽七。我們現(xiàn)在用嚴格的概率方法計算一下兩輪槍戰(zhàn)后景殷,甲乙丙各自的存活的幾率。
(1) 第一輪:
甲射乙锉走,乙射甲滨彻,丙射甲。
甲的活率為24%(40% X 60%)挪蹭,乙的活率為20%(100% - 80%)亭饵,丙的活率為100%(無人射丙)。
(2) 第二輪:
情況1:甲活乙死(24% X 80% = 19.2%)
甲射丙梁厉,丙射甲──甲的活率為60%辜羊,丙的活率為20%。
情況2:乙活甲死(20% X 76% = 15.2%)
乙射丙词顾,丙射乙──乙的活率為60%八秃,丙的活率為40%。
情況3:甲乙皆活(24% X 20% = 4.8%)
重復第一輪肉盹。
情況4:甲乙皆死(76% X 80% = 60.8%)
槍戰(zhàn)結束昔驱。
甲的活率為12.672%
(19.2% X 60%) + (4.8% X 24%) = 12.672%
乙的活率為10.08%
(15.2% X 60%) + (4.8% X 20%) = 10.08%
丙的活率為75.52%
(19.2% X 20%) + (15.2% X 40%) + (4.8% X 100%) + (60.8% X 100%) = 75.52%
通過對兩輪槍戰(zhàn)的詳細概率計算,我們仍然發(fā)現(xiàn)槍法最差的丙存活的幾率最大上忍,槍法較好的甲和乙的存活幾率仍遠低于丙的存活幾率骤肛。
對于這樣的例子,有人會發(fā)出“英雄創(chuàng)造歷史窍蓝,庸人繁衍子孫”的感嘆腋颠。
我們現(xiàn)在改變游戲規(guī)則,假定甲乙丙不是同時開槍吓笙,而是他們輪流開一槍淑玫。在這個例子中,我們發(fā)現(xiàn)丙的機會好于他的實力,丙不會被第一槍干掉絮蒿,并且他可能極有機會在下一輪中先開槍尊搬。
先假定開槍的順序是甲、乙土涝、丙毁嗦,甲一槍將乙干掉后(80%的幾率),就輪到丙開槍回铛,丙有40%的幾率一槍將甲干掉。即使乙躲過甲的第一槍克锣,輪到乙開槍茵肃,乙還是會瞄準槍法最好的甲開槍,即使乙這一槍干掉了甲袭祟,下一輪仍然是輪到丙開槍验残。無論是甲或者乙先開槍,乙都有在下一輪先開槍的優(yōu)勢巾乳。
如果是丙先開槍您没,情況又如何呢汗菜?
丙可以向甲先開槍剔宪,即使丙打不中甲划滋,甲的最佳策略仍然是向乙開槍艰额。但是糜工,如果丙打中了甲晦雨,下一輪可就是乙開槍打丙了巩割。因此密浑,丙的最佳策略是胡亂開一槍种冬,只要丙不打中甲或者乙镣丑,在下一輪射擊中他就處于有利的形勢。
我們通過這個例子娱两,可以理解人們在博弈中能否獲勝莺匠,不單純取決于他們的實力,更重要的是取決于博弈方實力對比所形成的關系十兢。
在上面的例子中趣竣,乙和丙實際上是一種聯(lián)盟關系,先把甲干掉纪挎,他們的生存幾率都上升了期贫。我們現(xiàn)在來判斷一下,乙和丙之中异袄,誰更有可能背叛通砍,誰更可能忠誠?
任何一個聯(lián)盟的成員都會時刻權衡利弊,一旦背叛的好處大于忠誠的好處封孙,聯(lián)盟就會破裂迹冤。在乙和丙的聯(lián)盟中,乙是最忠誠的虎忌。這不是因為乙本身具有更加忠誠的品質泡徙,而是利益關系使然。只要甲不死膜蠢,乙的槍口就一定會瞄準甲堪藐。但丙就不是這樣了,丙不瞄準甲而胡亂開一槍顯然違背了聯(lián)盟關系挑围,丙這樣做的結果礁竞,將使乙處于更危險的境地。
合作才能對抗強敵杉辙。只有乙丙合作模捂,才能把甲先干掉。如果蜘矢,乙丙不和狂男,乙或丙單獨對甲都不占優(yōu),必然被甲先后解決品腹。
六岖食、智豬博弈
改變方案一:減量方案。投食僅原來的一半分量珍昨。結果是小豬大豬都不去踩踏板了县耽。小豬去踩,大豬將會把食物吃完镣典;大豬去踩兔毙,小豬將也會把食物吃完。誰去踩踏板兄春,就意味著為對方貢獻食物澎剥,所以誰也不會有踩踏板的動力了。如果目的是想讓豬們去多踩踏板赶舆,這個游戲規(guī)則的設計顯然是失敗的哑姚。
改變方案二:增量方案。投食為原來的一倍分量芜茵。結果是小豬叙量、大豬都會去踩踏板。誰想吃九串,誰就會去踩踏板绞佩。反正對方不會一次把食物吃完寺鸥。小豬和大豬相當于生活在物質相對豐富的“共產主義”社會,所以競爭意識卻不會很強品山。對于游戲規(guī)則的設計者來說胆建,這個規(guī)則的成本相當高(每次提供雙份的食物);而且因為競爭不強烈肘交,想讓豬們去多踩踏板的效果并不好笆载。
改變方案三:減量加移位方案。投食僅原來的一半分量涯呻,但同時將投食口移到踏板附近凉驻。結果呢,小豬和大豬都在拼命地搶著踩踏板复罐。等待者不得食沿侈,而多勞者多得。每次的收獲剛好消費完市栗。對于游戲設計者,這是一個最好的方案咳短。成本不高填帽,但收獲最大。
股市上等待莊家抬轎的散戶咙好;等待產業(yè)市場中出現(xiàn)具有贏利能力新產品篡腌、繼而大舉仿制牟取暴利的游資;公司里不創(chuàng)造效益但分享成果的人勾效,等嘹悼。
公司的激勵制度設計,獎勵力度太大层宫,又是持股杨伙,又是期權,成本高不說萌腿,員工的積極性并不一定很高限匣。這相當于“智豬博弈”增量方案所描述的情形。但是如果獎勵力度不大毁菱,而且見者有份米死,一度十分努力的大豬也不會有動力了就象“智豬博弈”減量方案所描述的情形。最好的激勵機制設計就象改變方案三-減量加移位的辦法贮庞,獎勵并非人人有份峦筒,而是直接針對個人。