第1節(jié) 什么是博弈論:從“囚徒困境”說(shuō)起
一天控汉,警局接到報(bào)案笔诵,一位富翁被殺死在自己的別墅中,家中的財(cái)物也被洗劫一空姑子。經(jīng)過(guò)多方調(diào)查乎婿,警方最終將嫌疑人鎖定在杰克和亞當(dāng)身上,因?yàn)槭掳l(fā)當(dāng)晚有人看到他們兩個(gè)神色慌張地從被害人的家中跑出來(lái)街佑。警方到兩人的家中進(jìn)行搜查谢翎,結(jié)果發(fā)現(xiàn)了一部分被害人家中失竊的財(cái)物,于是將二人作為謀殺和盜竊嫌疑人拘留沐旨。
但是到了拘留所里面森逮,兩人都矢口否認(rèn)自己殺過(guò)人,他們辯稱(chēng)自己只是路過(guò)那里磁携,想進(jìn)去偷點(diǎn)東西褒侧,結(jié)果進(jìn)去的時(shí)候發(fā)現(xiàn)主人已經(jīng)被人殺死了,于是他們便隨便拿了點(diǎn)東西就走了颜武。這樣的解釋不能讓人信服璃搜,再說(shuō)拖吼,誰(shuí)都知道在判刑方面殺人要比盜竊嚴(yán)重得多鳞上。警察決定將兩人隔離審訊。
隔離審訊的時(shí)候吊档,警察告訴杰克:“盡管你們不承認(rèn)篙议,但是我知道人就是你們兩個(gè)殺的,事情早晚會(huì)水落石出的〉∨穑現(xiàn)在我給你一個(gè)坦白的機(jī)會(huì)鬼贱,如果你坦白了,亞當(dāng)拒不承認(rèn)香璃,那你就是主動(dòng)自首这难,同時(shí)協(xié)助警方破案,你將被立即釋放葡秒,亞當(dāng)則要坐10年牢姻乓;如果你們都坦白了,每人坐8年牢眯牧;都不坦白的話(huà)蹋岩,可能以入室盜竊罪判你們每人1年,如何選擇你自己想一想吧学少〖舾觯”同樣的話(huà),警察也說(shuō)給了亞當(dāng)版确。
一般人可能認(rèn)為杰克和亞當(dāng)都會(huì)選擇不坦白扣囊,這樣他們只能以入室盜竊的罪名被判刑乎折,每人只需坐1年牢。這對(duì)于兩人來(lái)說(shuō)是最好的一種結(jié)局侵歇“侍矗可結(jié)果會(huì)是這樣的嗎?答案是否定的盒至,兩人都選擇了招供酗洒,結(jié)果各被判了8年。
事情為什么會(huì)這樣呢枷遂?杰克和亞當(dāng)為什么會(huì)做出這樣“不理智”的選擇呢樱衷?其實(shí)這種結(jié)果正是兩人的理智造成的。我們先看一下兩人坦白與否及其結(jié)局的矩陣圖:
當(dāng)警察把坦白與否的后果告訴杰克的時(shí)候酒唉,杰克心中就會(huì)開(kāi)始盤(pán)算坦白對(duì)自己有利矩桂,還是不坦白對(duì)自己有利。杰克會(huì)想痪伦,如果選擇坦白侄榴,要么當(dāng)即釋放,要么同亞當(dāng)一起坐8年牢网沾;要是選擇不坦白癞蚕,雖然可能只坐1年牢,但也可能坐10年牢辉哥。雖然(1桦山,1)對(duì)兩人而言是最好的一種結(jié)局,但是由于是被分開(kāi)審訊醋旦,信息不通馏谨,所以誰(shuí)也沒(méi)法保證對(duì)方是否會(huì)選擇坦白蛀醉。選擇坦白的結(jié)局是8年或者0年修壕,選擇不坦白的結(jié)局是10年或者1年腐魂,在不知道對(duì)方選擇的情況下,選擇坦白對(duì)自己來(lái)說(shuō)是一種優(yōu)勢(shì)策略捂人。于是御雕,杰克會(huì)選擇坦白。同時(shí)先慷,亞當(dāng)也會(huì)這樣想饮笛。最終的結(jié)局便是兩個(gè)人都選擇坦白,每人都要坐8年牢论熙。
上面這個(gè)案例就是著名的“囚徒困境”模式福青,是博弈論中最出名的一個(gè)模式。為什么杰克和亞當(dāng)都選擇了對(duì)自己最有利的策略,最后得到的卻是最差的結(jié)果呢无午?這其中便蘊(yùn)涵著博弈論的道理媒役。
博弈論是指雙方或者多方在競(jìng)爭(zhēng)、合作宪迟、沖突等情況下酣衷,充分了解各方信息,并依此選擇一種能為本方爭(zhēng)取最大利益的最優(yōu)決策的理論次泽。
“囚徒困境”中杰克和亞當(dāng)便是參與博弈的雙方穿仪,也稱(chēng)為博弈參與者。兩人之所以陷入困境意荤,是因?yàn)樗麄儧](méi)有選擇對(duì)兩人來(lái)說(shuō)最優(yōu)的決策啊片,也就是同時(shí)不坦白。而根本原因則是兩人被隔離審訊玖像,無(wú)法掌握對(duì)方的信息紫谷。所以,看似每個(gè)人都做出了對(duì)自己最有利的策略捐寥,結(jié)果卻是兩敗俱傷笤昨。
我們身邊的很多事情和典故中也有博弈論的應(yīng)用,我們就用大家比較熟悉的“田忌賽馬”這個(gè)故事來(lái)解釋一下什么是博弈論握恳。
齊國(guó)大將田忌瞒窒,平日里喜歡與貴族賽馬賭錢(qián)。當(dāng)時(shí)賽馬的規(guī)矩是每一方出上等馬睡互、中等馬根竿、下等馬各一匹陵像,共賽三場(chǎng)就珠,三局兩勝制。由于田忌的馬比貴族們的馬略遜一籌醒颖,所以十賭九輸妻怎。當(dāng)時(shí)孫臏在田忌的府中做客,經(jīng)常見(jiàn)田忌同貴族們賽馬泞歉,對(duì)賽馬的比賽規(guī)則和雙方馬的實(shí)力差距都比較了解逼侦。這天田忌賽馬又輸了,非常沮喪地回到府中腰耙。孫臏見(jiàn)狀榛丢,便對(duì)田忌說(shuō):“明天你盡管同那些貴族們下大賭注,我保證讓你把以前輸?shù)娜A回來(lái)挺庞∥蓿”田忌相信了孫臏,第二天約貴族賽馬,并下了千金賭注掖鱼。
孫臏為什么敢打保證呢然走?因?yàn)樗麑?duì)這場(chǎng)賽馬的博弈做了分析:雙方都派上等、中等戏挡、下等馬各一匹芍瑞,田忌每一等級(jí)的馬都比對(duì)方同一等級(jí)的馬慢一點(diǎn),因?yàn)闆](méi)有規(guī)定出場(chǎng)順序褐墅,所以比賽的對(duì)陣形式可能有六種拆檬,每一種對(duì)陣形式的結(jié)局是很容易猜測(cè)的:
第一種情況:上等馬對(duì)上等馬,中等馬對(duì)中等馬妥凳,下等馬對(duì)下等馬秩仆。結(jié)局:三局零勝。第二種情況:上等馬對(duì)上等馬猾封,下等馬對(duì)中等馬澄耍,中等馬對(duì)下等馬。結(jié)局:三局一勝晌缘。
第三種情況:中等馬對(duì)上等馬齐莲,上等馬對(duì)中等馬,下等馬對(duì)下等馬磷箕。結(jié)局:三局一勝选酗。
第四種情況:中等馬對(duì)上等馬,下等馬對(duì)中等馬岳枷,上等馬對(duì)下等馬芒填。結(jié)局:三局一勝。
第五種情況:下等馬對(duì)上等馬空繁,上等馬對(duì)中等馬殿衰,中等馬對(duì)下等馬。結(jié)局:三局兩勝盛泡。
第六種情況:下等馬對(duì)上等馬闷祥,中等馬對(duì)中等馬,上等馬對(duì)下等馬傲诵。結(jié)局:三局一勝凯砍。
六種對(duì)陣形式中,只有一種能使田忌取勝拴竹,孫臏采取的正是這一種悟衩。賽前孫臏對(duì)田忌說(shuō):“你用自己的下等馬去對(duì)陣他的上等馬,然后用上等馬去對(duì)陣他的中等馬栓拜,最后用中等馬去對(duì)陣他的下等馬座泳“呦欤”比賽結(jié)束之后,田忌三局兩勝钳榨,贏得了比賽舰罚。田忌從此對(duì)孫臏刮目相看,并將他推薦給了齊威王薛耻。同樣的馬营罢,只是調(diào)整了出場(chǎng)順序,便取得截然相反的結(jié)果饼齿。這里邊蘊(yùn)涵著博弈論的道理饲漾。
在田忌賽馬這個(gè)故事中,田忌同齊國(guó)的貴族便是博弈的雙方缕溉,也稱(chēng)為博弈的參與者考传。孫臏充分了解了各方的信息,也就是比賽的規(guī)則與各匹馬之間的實(shí)力差距证鸥,并在六種可以選擇的策略中幫田忌選擇了一個(gè)能爭(zhēng)取最大利益的策略僚楞,也就是最優(yōu)策略。所以說(shuō)枉层,這是一個(gè)很典型的博弈論在實(shí)際中應(yīng)用的例子泉褐。
在這里還要區(qū)分一下博弈與博弈論的概念,以免搞混鸟蜡。它們既有共同點(diǎn)膜赃,又有很大的差別∪嗤“博弈”的字面意思是指賭博和下圍棋跳座,用來(lái)比喻為了利益進(jìn)行競(jìng)爭(zhēng)。自從人類(lèi)存在的那一天開(kāi)始泣矛,博弈便存在疲眷,我們身邊也無(wú)時(shí)無(wú)刻不在上演著一場(chǎng)場(chǎng)博弈。而博弈論則是一種系統(tǒng)的理論乳蓄,屬于應(yīng)用數(shù)學(xué)的一個(gè)分支咪橙。可以說(shuō)博弈中體現(xiàn)著博弈論的思想虚倒,是博弈論在現(xiàn)實(shí)中的體現(xiàn)。
博弈作為一種爭(zhēng)取利益的競(jìng)爭(zhēng)产舞,始終伴隨著人類(lèi)的發(fā)展魂奥。但是博弈論作為一門(mén)科學(xué)理論,是1928年由美籍匈牙利數(shù)學(xué)家約翰·馮·諾依曼建立起來(lái)的易猫。他同時(shí)也是計(jì)算機(jī)的發(fā)明者耻煤,計(jì)算機(jī)在發(fā)明最初不過(guò)是龐大、笨重的算數(shù)器,但是今天已經(jīng)深深影響到了我們生活哈蝇、工作的各個(gè)方面棺妓。博弈論也是如此,最初馮·諾依曼證明了博弈論基本原理的時(shí)候炮赦,它只不過(guò)是一個(gè)數(shù)學(xué)理論怜跑,對(duì)現(xiàn)實(shí)生活影響甚微,所以沒(méi)有引起人們的注意吠勘。直到1944年性芬,馮·諾依曼與摩根斯坦合著的《博弈論與經(jīng)濟(jì)行為》發(fā)行出版剧防。這本書(shū)的面世意義重大植锉,先前馮·諾依曼的博弈理論主要研究二人博弈,這本書(shū)將研究范圍推廣到多人博弈峭拘;同時(shí)俊庇,還將博弈論從一種單純的理論應(yīng)用于經(jīng)濟(jì)領(lǐng)域。在經(jīng)濟(jì)領(lǐng)域的應(yīng)用鸡挠,奠定了博弈論發(fā)展為一門(mén)學(xué)科的基礎(chǔ)和理論體系暇赤。
談到博弈論的發(fā)展,就不能不提到約翰·福布斯·納什宵凌。這是一位傳奇的人物鞋囊,他于1950年寫(xiě)出了論文《n人博弈中的均衡點(diǎn)》,當(dāng)時(shí)年僅22歲瞎惫。第二年他又發(fā)表了另外一篇論文《非合作博弈》溜腐。這兩篇論文將博弈論的研究范圍和應(yīng)用領(lǐng)域大大推廣。論文中提出的“納什均衡”已經(jīng)成為博弈論中最重要和最基礎(chǔ)的理論瓜喇。他也因此成為一代大師挺益,并于1994年獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。后面我們還會(huì)詳細(xì)介紹納什其人與“納什均衡”理論乘寒。
經(jīng)濟(jì)學(xué)史上有三次偉大的革命望众,它們是“邊際分析革命”“凱恩斯革命”和“博弈論革命”。博弈論為人們提供了一種解決問(wèn)題的新方法伞辛。
博弈論發(fā)展到今天烂翰,已經(jīng)成了一門(mén)比較完善的學(xué)科,應(yīng)用范圍也涉及各個(gè)領(lǐng)域蚤氏。研究博弈論的經(jīng)濟(jì)學(xué)家獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的比例是最高的甘耿,由此也可以看出博弈論的重要性和影響力。2005年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)又一次頒發(fā)給了研究博弈論的經(jīng)濟(jì)學(xué)家竿滨,瑞典皇家科學(xué)院給出的授獎(jiǎng)理由是“他們對(duì)博弈論的分析佳恬,加深了我們對(duì)合作和沖突的理解”捏境。
那么博弈論對(duì)我們個(gè)人的生活有什么影響呢?這種影響可以說(shuō)是無(wú)處不在的毁葱。
假設(shè)垫言,你去酒店參加一個(gè)同學(xué)的生日聚會(huì),當(dāng)天晚上他的親人倾剿、朋友筷频、同學(xué)、同事去了很多人柱告,大家都玩得很高興截驮。可就在這時(shí)际度,外面突然失火葵袭,并且火勢(shì)很大,無(wú)法撲滅乖菱,只能逃生坡锡。酒店里面人很多,但是安全出口只有兩個(gè)窒所。一個(gè)安全出口距離較近鹉勒,但是人特別多,大家都在擁擠吵取;另外一個(gè)安全出口人很少禽额,但是距離相對(duì)遠(yuǎn)。如果拋開(kāi)道德因素來(lái)考慮皮官,這時(shí)你該如何選擇脯倒?
這便是一個(gè)博弈論的問(wèn)題。我們知道捺氢,博弈論就是在一定情況下藻丢,充分了解各方面信息,并做出最優(yōu)決策的一種理論摄乒。在這個(gè)例子里悠反,你身處火災(zāi)之中,了解到的信息就是遠(yuǎn)近共有兩個(gè)安全門(mén)馍佑,以及這兩個(gè)門(mén)的擁擠程度斋否。在這里,你需要做出最優(yōu)決策挤茄,也就是最有可能逃生的選擇如叼。那應(yīng)該如何選擇呢?