博弈論中有這樣一個(gè)故事坪仇,兩個(gè)人同時(shí)碰到了一只非常兇悍的獅子(即兩人就算聯(lián)手也無法戰(zhàn)勝這只獅子),其中一人撒腿就跑垃你。沒跑的那個(gè)人奇怪的問跑的人椅文,“你跑的再快能快過獅子嗎喂很?”。而跑的人回答說:“我沒必要跑贏獅子呀皆刺,只要跑的比你快就行了”少辣。這個(gè)故事說明了一個(gè)問題,就是要認(rèn)清你的對(duì)手到底是誰羡蛾。而這次談?wù)摰那敉嚼Ь硠t是雙方互猜對(duì)方(可以是敵人或者是盟友)心理的博弈漓帅。
“囚徒困境”是1950年美國蘭德公司的梅里爾·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關(guān)困境的理論,后來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式闡述痴怨,并命名為“囚徒困境”忙干。兩個(gè)共謀犯罪的人被關(guān)入監(jiān)獄,不能互相溝通情況浪藻。如果兩個(gè)人都不揭發(fā)對(duì)方捐迫,則由于證據(jù)不確定,每個(gè)人都坐牢一年爱葵;若一人揭發(fā)施戴,而另一人沉默,則揭發(fā)者因?yàn)榱⒐Χ⒓传@釋钧惧,沉默者因不合作而入獄十年暇韧;若互相揭發(fā),則因證據(jù)確實(shí)浓瞪,二者都判刑八年懈玻。由于囚徒無法信任對(duì)方,因此傾向于互相揭發(fā)乾颁,而不是同守沉默涂乌。最終導(dǎo)致納什均衡僅落在非合作點(diǎn)上的博弈模型∮⒘耄【1】
囚徒困境(prisoner's dilemma):兩個(gè)被捕的囚徒之間的一種特殊博弈湾盒,說明為什么甚至在合作對(duì)雙方都有利時(shí),保持合作也是困難的诅妹。囚徒困境是博弈論的非零和博弈中具代表性的例子罚勾,反映個(gè)人最佳選擇并非團(tuán)體最佳選擇。雖然困境本身只屬模型性質(zhì)吭狡,但現(xiàn)實(shí)中的價(jià)格競(jìng)爭(zhēng)划煮、環(huán)境保護(hù)等方面,也會(huì)頻繁出現(xiàn)類似情況器躏。【1】
看完這個(gè)問題后登失,很多人的第一反應(yīng)肯定是互不揭發(fā)壁畸,原因很簡單嘛,都只用坐一年牢太抓,你好我好大家好令杈。但是仔細(xì)想想逗噩,這里面的問題很有意思异雁,兩人隔離在不同的牢房,沒辦法信息交流纲刀,說白了對(duì)方的選擇你只能猜測(cè)示绊。再說的直接一點(diǎn)面褐,在我看來其實(shí)對(duì)方做的選擇,你可以直接看成一個(gè)既定事實(shí)湃窍,這就造成兩種結(jié)果:
1.對(duì)方心地善良并且相信你坝咐,他不揭發(fā)你析恢。倘若你揭發(fā)他映挂,你免受牢獄之災(zāi);不揭發(fā)他帽撑,你坐牢1年亏拉。
2.對(duì)方心狠手辣并且不相信你逆巍,接發(fā)了你。倘若你揭發(fā)他笙僚,你坐牢8年肋层;不揭發(fā)他栋猖,你坐牢10年汪榔。
顯然在兩種情況下揍异,揭發(fā)都是最好的選擇。但這個(gè)帕累托改進(jìn)(如果一個(gè)經(jīng)濟(jì)體不是帕累托最優(yōu)辱姨,則存在一些人在不使其他人的境況變壞的情況下而使自己的境況變好的情形雨涛。普遍認(rèn)為這樣低效的產(chǎn)出的情況是需要避免的懦胞,因此帕累托最優(yōu)是評(píng)價(jià)一個(gè)經(jīng)濟(jì)體和政治方針的非常重要的標(biāo)準(zhǔn)。)辦不到蚯根,因?yàn)樗荒軡M足人類的理性要求颅拦。囚徒困境所反映出的深刻問題是,人類的個(gè)人理性有時(shí)能導(dǎo)致集體的非理性——聰明的人類會(huì)因自己的聰明而作繭自縛距帅。(這里如同博弈論的其他例證碌秸,囚徒困境假定每個(gè)參與者(即“囚徒”)都是利己的讥电,即都尋求最大自身利益,而不關(guān)心另一參與者的利益恼策,這也就是經(jīng)典經(jīng)濟(jì)學(xué)中的“理性人假設(shè)”涣楷。參與者某一策略所得利益狮斗,如果在任何情況下都比其他策略要低的話弧蝇,此策略稱為“嚴(yán)格劣勢(shì)”沙峻,理性的參與者絕不會(huì)選擇两芳。另外,沒有任何其他力量干預(yù)個(gè)人決策是复,參與者可完全按照自己意愿選擇策略淑廊。)季惩。
可見在一次囚徒問題中蜀备,毫無疑問碾阁,出現(xiàn)互相舉報(bào)的幾率是最大的脂凶,對(duì)個(gè)人來說蚕钦,舉報(bào)其實(shí)也是最好的選擇,但其實(shí)最后得到的結(jié)果卻對(duì)任何人來說都不是最佳結(jié)果嘶居。這是一個(gè)很骨感邮屁,很現(xiàn)實(shí)的事情,如果喜歡思考的人可能已經(jīng)開始想了绳匀,如果是多次囚徒問題呢?
多次囚徒問題也分為兩種戈钢,一是確定次數(shù)(即次數(shù)n為一確定常數(shù))殉了,這時(shí)我覺得用囚徒模型有點(diǎn)怪異宣渗。用一個(gè)相關(guān)模型來解釋較為合理(霍夫施塔特曾提出的“封閉袋子交易”)痕囱,
兩人面對(duì)面互相交換封閉的袋子,共同了解其中一方放錢,另一方放商品弦悉。雙方可以誠實(shí)的依照承諾稽莉,把東西放到袋子里交換涩搓;又或者交空袋子給對(duì)方污秆,選擇背叛。這里我們最好的辦法是反推昧甘,選擇最后一次良拼,可想而知大家如果到了最后一回合,肯定雙方都會(huì)選擇交空袋子充边。于是在此之前的一個(gè)回合庸推,雙方會(huì)推測(cè)下一次對(duì)方肯定會(huì)交空袋子,于是自己會(huì)提前交空袋子浇冰,依次類推贬媒。最后到第一回合,其實(shí)跟只進(jìn)行一次的結(jié)果相同湖饱。
第二種掖蛤,不確定n的具體次數(shù)。
羅伯特·阿克塞爾羅德在其著作《合作的進(jìn)化》中,探索了經(jīng)典囚徒困境情景的一個(gè)擴(kuò)展,并把它稱作“重復(fù)的囚徒困境”(IPD)。在這個(gè)博弈中夏醉,參與者必須反復(fù)地選擇他們彼此相關(guān)的策略臣樱,并且記住他們以前的對(duì)抗踩蔚。阿克塞爾羅德邀請(qǐng)全世界的學(xué)術(shù)同行來設(shè)計(jì)計(jì)算機(jī)策略捞蛋,并在一個(gè)重復(fù)囚徒困境競(jìng)賽中互相競(jìng)爭(zhēng)量承。
阿克塞爾羅德發(fā)現(xiàn)泣洞,當(dāng)這些對(duì)抗被每個(gè)選擇不同策略的參與者一再重復(fù)了很長時(shí)間之后,從利己的角度來判斷甩挫,最終“貪婪”策略趨向于減少,而比較“利他”策略更多地被采用。他用這個(gè)博弈來說明税灌,通過自然選擇,一種利他行為的機(jī)制可能從最初純粹的自私機(jī)制進(jìn)化而來。
最佳確定性策略被認(rèn)為是“以牙還牙”,這是阿納托爾·拉波波特(Anatol Rapoport)開發(fā)并運(yùn)用到錦標(biāo)賽中的方法。它是所有參賽程序中最簡單的,只包含了四行BASIC語言,并且贏得了比賽蝙砌。這個(gè)策略只不過是在重復(fù)博弈的開頭合作祠饺,然后,采取你的對(duì)手前一回合的策略换途。更好些的策略是“寬恕地以牙還牙”誓禁。當(dāng)你的對(duì)手背叛俗慈,在下一回合中你無論如何要以小概率(大約是1%~5%)時(shí)而合作一下馏颂。這是考慮到偶爾要從循環(huán)背叛的受騙中復(fù)原。當(dāng)錯(cuò)誤傳達(dá)被引入博弈時(shí)黔姜,“寬恕地以牙還牙”是最佳的秆吵。這意味著有時(shí)你的動(dòng)作被錯(cuò)誤地傳達(dá)給你的對(duì)手:你合作但是你的對(duì)手聽說你背叛了淮椰≈魉耄【1】
通過分析高分策略晦雨,阿克塞爾羅德指定了策略獲得成功的幾個(gè)必要條件夹抗。
友善
最重要的條件是策略必須“友善”已脓,這就是說,不要在對(duì)手背叛之前先背叛贞奋。幾乎所有的高分策略都是友善的赌厅。因此,完全自私的策略僅僅出于自私的原因轿塔,也永遠(yuǎn)不會(huì)首先打擊其對(duì)手特愿。
報(bào)復(fù)
但是,成功的策略必須不是一個(gè)盲目樂觀的催训,要適時(shí)報(bào)復(fù)洽议。一個(gè)非報(bào)復(fù)策略的例子是始終合作。這是一個(gè)非常糟糕的選擇漫拭,因?yàn)槭冀K選擇不合作的策略將殘酷地剝削這樣的傻瓜亚兄。
寬恕
成功策略的另一個(gè)品質(zhì)是必須要寬恕。如果對(duì)手不繼續(xù)背叛采驻,它們會(huì)一再退卻到合作审胚。這停止了報(bào)復(fù)和反報(bào)復(fù)的長期進(jìn)行以導(dǎo)致的得分低的問題匈勋。
不嫉妒
最后一個(gè)品質(zhì)是不嫉妒,就是說不去爭(zhēng)取得到高于對(duì)手的分?jǐn)?shù)(“友善”的策略必然不嫉妒膳叨,也就是說“友善”的策略永遠(yuǎn)無法得到高于對(duì)手的分?jǐn)?shù))洽洁。
因此,阿克塞爾羅德認(rèn)為自私的個(gè)人為了其自私的利益會(huì)趨向友善菲嘴、寬恕和不嫉妒饿自。阿克塞爾羅德關(guān)于重復(fù)囚徒困境的研究的重要結(jié)論之一,是友善的家伙能先完成交易龄坪。
我們據(jù)此昭雌,來分析一些商業(yè)上的案例。
1.兩個(gè)壟斷公司的廣告競(jìng)爭(zhēng)(我覺得這里得主要強(qiáng)調(diào)兩個(gè)和壟斷)
兩個(gè)公司各分行業(yè)的半壁江山健田,而為了讓自己的產(chǎn)品更具影響力烛卧。兩家公司不斷在廣告上下功夫,以增強(qiáng)自己的影響力妓局。眾所周知总放,廣告上的投資通常消耗很大,而兩公司為了競(jìng)爭(zhēng)更是花大價(jià)錢去提高廣告質(zhì)量好爬。這時(shí)有兩種選擇:
(1)合作局雄,達(dá)成協(xié)議一起減少廣告上的投資
(2)背叛,設(shè)法通過廣告質(zhì)量來壓垮對(duì)手存炮,去增加廣告投入
若兩個(gè)公司互相不信任對(duì)方哎榴,無法合作,二公司將陷入廣告戰(zhàn)僵蛛,而廣告成本的增加其實(shí)使兩個(gè)公司利益都受到了損害,這就是陷入囚徒困境迎变。在現(xiàn)實(shí)中充尉,要兩個(gè)互相競(jìng)爭(zhēng)的公司達(dá)成合作協(xié)議是較為困難的,多數(shù)都會(huì)陷入囚徒困境中衣形。
其實(shí)這其中還涉及到“斯塔克伯格模型”問題驼侠,在雙寡頭廠商的競(jìng)爭(zhēng)中,兩個(gè)廠商并不總是同時(shí)做出它們的產(chǎn)量決策的谆吴,斯塔克伯格研究了兩廠商之一如果先決定自己的產(chǎn)量倒源,然后是另一個(gè)廠商看到對(duì)方的產(chǎn)量后才做出它的產(chǎn)量決策的情況。他的研究結(jié)果表明句狼,首先行動(dòng)的廠商會(huì)獲得一種利益笋熬。理由就是先宣布就造成了一種既成事實(shí)——不管你的競(jìng)爭(zhēng)者怎么做,你的產(chǎn)量都是大的腻菇。為了使利潤最大化胳螟,你的競(jìng)爭(zhēng)者就必須將你的高產(chǎn)量水平作為給定的昔馋,并為它自己定一個(gè)低產(chǎn)量水平。如果你的競(jìng)爭(zhēng)者生產(chǎn)一個(gè)大的產(chǎn)量水平糖耸,這就會(huì)將價(jià)格壓低秘遏,你們雙方都會(huì)虧損。所以除非你的競(jìng)爭(zhēng)者把“爭(zhēng)取平等”看得比賺錢還重要嘉竟,否則他生產(chǎn)一個(gè)大的數(shù)量是不合乎理性的邦危。這其中其實(shí)也極容易產(chǎn)生囚徒問題。
2.公共用品問題
比如捕魚舍扰,每個(gè)漁民心里都想著如果我不捕撈倦蚪,其他的漁民也一定會(huì)捕撈,此時(shí)就非常容易產(chǎn)生過度捕撈妥粟,而造成海洋生態(tài)環(huán)境的破壞审丘,導(dǎo)致漁民自己的收益下降(共同背叛的結(jié)果)。
其實(shí)上述的兩個(gè)例子勾给,在長期下都可能有一天會(huì)轉(zhuǎn)向合作滩报,這其中可能會(huì)有雙方協(xié)調(diào)或者像政府干預(yù)等來打破這種囚徒問題。這之間的聰明人和愚蠢者很難判斷播急,很大程度上取決于對(duì)方脓钾,或者說取決于信任。博弈全輸桩警,合作雙贏可训,懷疑或不信任導(dǎo)致失敗。
真正的聰明人可能是那些能相互拿出信任籌碼者吧捶枢。