36博弈的基本概念
行動:參與人在某個時點(diǎn)的決策變量,Ai表示第i個參與人的一個特定行動墓懂,
Ai={ai}表示可供i選擇的所有行動的集。
行動的順序:行動的順序?qū)τ诓┺牡慕Y(jié)果是非常重要的霉囚,事實(shí)上捕仔,不同的行動順序意味著不同的博弈。
在博弈論中盈罐,一般假設(shè)參與人的行動空間和行動順序是所有參與人的共同知識榜跌。
信息:參與人在博弈中的知識,特別是有關(guān)其他參與人的特征和行動的知識暖呕。
如房地產(chǎn)開發(fā)博弈中斜做,如果A不知道市場需求,而B知道湾揽,則A的信息集為{大瓤逼,小},B的信息集為{大}或{小}完美信息:指一個參與人對其他參與人(包括“自然”)的行動選擇有準(zhǔn)確了解的情況库物,即每一個信息集只包含一個值霸旗。
再如求愛博弈中,如果被求愛者不知道求愛者到底是品德優(yōu)良還是品德敗壞戚揭,而求愛者知道诱告,剛被求愛者的信息集為{優(yōu)良,惡劣}民晒,求愛者的信息集為{優(yōu)良}或{惡劣}精居。
完全信息:指自然不首先行動或自然的行動的初始行動所有參與人觀察到的情況。
共同知識:指“所有參與人知道所有參與人知道所有參與人知道…”的知識潜必。
戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則靴姿,它規(guī)定參與人在什么情況下選擇什么行動,是參與人的“相機(jī)行動方案”磁滚。
si表示第i個參與人的特定戰(zhàn)略Si={si}代表第i個參與人所有可選擇的戰(zhàn)略集合佛吓。
如果n個參與人每人選擇一個戰(zhàn)略,n維向量s=(s1垂攘,s2维雇,…,si晒他,…吱型,sn)稱為一個戰(zhàn)略組合,si表示第i個人選擇的戰(zhàn)略陨仅。
在靜態(tài)博弈中唁影,戰(zhàn)略和行動是相同的耕陷。作為一種行動規(guī)則掂名,戰(zhàn)略必須是完備的据沈。
支付函數(shù):參與人從博弈中獲得的效用水平,或者指參與人得到的期望效用水平饺蔑。
ui表示第i個參與人的支付(效用水平)锌介。
u=(u1,u2猾警,…孔祸,ui,…发皿,un)為n個人的支付組合崔慧。
ui是所有參與人戰(zhàn)略選擇的函數(shù):
ui=ui{s1均蜜,s2思灌,…槐秧,si体箕,…宰僧,sn}
博弈的基本特征是一個參與人的支付不僅取決于自己的戰(zhàn)略選擇考榨,而且取決于所有其他參與人的戰(zhàn)略選擇已日。
結(jié)果:博弈分析真正感興趣的要素的集合描姚。如均衡戰(zhàn)略組合松捉、均衡行動組合夹界、均衡支付組合等。
均衡:所有參與人的最優(yōu)戰(zhàn)略的組合隘世。參與人可柿、行動、結(jié)果稱為博弈規(guī)則丙者;博弈分析的目的是使用博弈規(guī)則決定均衡复斥。
37博弈的戰(zhàn)略式表述與擴(kuò)展式表達(dá)
戰(zhàn)略式表述:適用于靜態(tài)博弈。擴(kuò)展式表述:適用于動態(tài)博弈蔓钟。
博弈的基本構(gòu)造:
結(jié):包括決策結(jié)和終點(diǎn)結(jié)兩類永票;決策結(jié)是參與人行動的始點(diǎn),終點(diǎn)結(jié)是決策人行動的終點(diǎn)滥沫。
結(jié)滿足傳遞性和非對稱性侣集。
x之前的所有結(jié)的集合,稱為x的前列集P(x)兰绣,x之后的所有結(jié)的集合稱為x的后續(xù)集T(x)世分。
枝:枝是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個枝代表參與人的一個行動選擇缀辩。
信息集:每個信息集是決策結(jié)集合的一個子集臭埋,該子集包括所有滿足下列條件的決策結(jié):
1 每個決策結(jié)都是同一個參與人的決策結(jié)踪央;
2 該參與人知道博弈進(jìn)入該集合的某個決策結(jié),但不知道自己究竟處于哪一個決策結(jié)瓢阴。
博弈擴(kuò)展式表述:
只包含一個決策結(jié)的信息集稱為單結(jié)信息集畅蹂,如果博弈樹的所有信息都是單結(jié)的,該博弈稱為完美信息博弈荣恐。
自然總是假定是單結(jié)的液斜,因為自然在參與人決策之后行動等價于自然在參與人之前行動但參與人不能觀測到自然的行動。
不同的博弈樹可以代表相同的博弈叠穆,但是有一個基本規(guī)則:一個參與人在決策之前知道的事情少漆,必須出現(xiàn)在該參與人決策結(jié)之前。
38
完全信息動態(tài)搏弈——子博弈精煉納什均衡
考慮下列問題:
一個博弈可能有多個(甚至無窮多個)納什均衡硼被,究竟哪個更合理示损?
納什均衡假定每一個參與人在選擇自己的最優(yōu)戰(zhàn)略時假定所有其他參與人的戰(zhàn)略是給定的,但是如果參與人的行動有先有后嚷硫,后行動者的選擇空間依賴于前行動者的選擇检访,前行動者在選擇時不可能不考慮自己的行動對后行動者的影響。
子博弈精練納什均衡的一個重要改進(jìn)是將“合理納什均衡”與“不合理納什均衡”分開论巍。
子博弈精練納什均衡:
一個納什均衡稱為精練納什均衡烛谊,當(dāng)只當(dāng)參與人的戰(zhàn)略在每個子博弈中都構(gòu)成納什均衡,也就是說嘉汰,組成精練納什均衡的戰(zhàn)略必須在每一個子博弈中都是最優(yōu)的丹禀。
一個精練納什均衡首先必須是一個納什均衡,但納什均衡不一定是精練納什均衡鞋怀。
澤爾騰(1965)引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除双泪,從而給出動態(tài)博弈的一個合理的預(yù)測結(jié)果,簡單說密似,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上是最優(yōu)的焙矛。
子博弈精煉納什均衡——不可置信威脅。
美國普林斯頓大學(xué)古爾教授在1997年的《經(jīng)濟(jì)學(xué)透視》里發(fā)表文章残腌,提出一個例子說明威脅的可置性問題:
兩兄弟老是為玩具吵架村斟,哥哥老是要搶弟弟的玩具,不耐煩的父親宣布政策:好好去玩抛猫,不要吵我蟆盹,不管你們誰向我告狀,我都把你們兩個關(guān)起來闺金,關(guān)起來比沒有玩具更可怕逾滥。
現(xiàn)在,哥哥又把弟弟的玩具搶去玩了败匹,弟弟沒有辦法寨昙,只好說:快把玩具還我讥巡,不然我就要去告訴爸爸。各個想舔哪,你真要告訴爸爸欢顷,我是要倒霉的,可是你不告狀不過沒有玩具玩尸红,而告了狀卻要被關(guān)禁閉吱涉,告狀會使你的境遇變得更壞,所以你不會告狀外里,因此哥哥對弟弟的警告置之不理。
策略即:如果他選擇什么特石,我就怎樣行動的相機(jī)行動方案盅蝗。在擴(kuò)展式博弈里,參與人是相機(jī)行事姆蘸,即“等待”博弈到達(dá)一個自己的信息集(包含一個或多個決策結(jié)后墩莫,再采取行動方案)。
39擴(kuò)展式博弈的戰(zhàn)略組合
擴(kuò)展式博弈的戰(zhàn)略組合是一個子博弈精練納什均衡逞敷,如果:
(1)它是原博弈的納什均衡狂秦;
(2)它在每一個子博弈上給出納什均衡。
完全信息動態(tài)博弈——子博弈精練納什均衡:
如果一個博弈有幾個子博弈推捐,一個特定的納什均衡決定了原博弈樹上唯一的一條路徑裂问,這條路徑稱為“均衡路徑”,博弈樹上的其他路徑稱為“非均衡路徑”牛柒。
納什均衡只要求均衡戰(zhàn)略在均衡路徑的決策結(jié)上是最優(yōu)的堪簿;
而構(gòu)成子博弈精練納什均衡不僅要求在均衡路徑上策略是最優(yōu)的,而且在非均衡路徑上的決策結(jié)上也是最優(yōu)的皮壁。這是納什均衡與子博弈精練納什均衡的實(shí)質(zhì)區(qū)別椭更。
戰(zhàn)略是參與人行動規(guī)則的完備描述,它要告訴參與人在每一種可預(yù)見的情況下(即每一個決策結(jié))上選擇什么行動蛾魄,即使這種情況實(shí)際上沒有發(fā)生(甚至參與人并不預(yù)期它會發(fā)生)虑瀑。
因此,只有當(dāng)一個戰(zhàn)略規(guī)定的行動規(guī)則在所有可能的情況下都是最優(yōu)的滴须,它才是一個合理的可置信的戰(zhàn)略舌狗,子博弈精練納什均衡就是要剔除那些只在特定情況下是合理的而在其他情況下不合理的行動規(guī)則。
24強(qiáng)盜分贓(向前展望描馅,倒后推理)
有5個強(qiáng)盜搶得10枚硬幣把夸,在如何分贓上爭論不休,于是他們決定:(1)抽簽決定個人的號碼(1铭污,2恋日,3膀篮,4,5)
(2)由1號提出分配方案岂膳,然后5人表決誓竿,如果方案超過半數(shù)同于就通過,否則他被扔進(jìn)大海喂鯊魚谈截;
(3)1號死后筷屡,2號提方案,4人表決簸喂,當(dāng)且僅當(dāng)超過半數(shù)同意時方案通過毙死,否則2號被扔進(jìn)大海;
(4)依次類推喻鳄,知道找到一個每個人都接受的方案(當(dāng)然扼倘,如果只剩5號,他獨(dú)吞)
結(jié)果會如何除呵?
參與人1(丈夫)和參與人2(妻子)必須獨(dú)立決定出門時是否帶傘再菊。他們知道下雨和不下雨的可能性均為50%,支付函數(shù)為:如果只有一人帶傘颜曾,下雨時帶傘者的效用為-2.5纠拔,不帶傘者的效用為-3不下雨時帶傘的效用為-1,不帶的效用為0泛豪;如兩人都不帶傘稠诲,下雨時每人的效用為-5,不下雨時每人的效用為1候址;給出下列四種情況下的擴(kuò)展式及戰(zhàn)略式表述:
(1)兩人出門前都不知道是否會下雨吕粹;并且兩人同時決定是否帶傘(即每一方在決策時都不知道對方的決策);
(2)兩人在出門前都不知道是否會下雨岗仑,但丈夫先決策匹耕,妻子觀察到丈夫是否帶傘后才決定自己是否帶傘;
(3)丈夫出門前知道是否會下雨荠雕,但妻子不知道稳其,但丈夫先決策,妻子后決策炸卑;
(4)既鞠,同(3),但妻子先決策盖文,丈夫后決策嘱蛋。