定義
博弈論是二人在平等的對(duì)局中各自利用對(duì)方的策略變換自己的對(duì)抗策略,達(dá)到取勝的目的嫌吠。
要素
博弈論有以下幾個(gè)要素:
- 1.局中人:在一場競賽或博弈中,每一個(gè)有決策權(quán)的參與者成為一個(gè)局中人堵腹。只有兩個(gè)局中人的博弈現(xiàn)象稱為“兩人博弈”测萎,而多于兩個(gè)局中人的博弈稱為“多人博弈”闹伪。
- 2.策略:一局博弈中沪铭,每個(gè)局中人都有選擇實(shí)際可行的完整的行動(dòng)方案壮池,即方案不是某階段的行動(dòng)方案,而是指導(dǎo)整個(gè)行動(dòng)的一個(gè)方案杀怠,一個(gè)局中人的一個(gè)可行的自始至終全局籌劃的一個(gè)行動(dòng)方案椰憋,稱為這個(gè)局中人的一個(gè)策略。如果在一局博弈中局中人都總共有有限個(gè)策略赔退,則稱為“有限博弈”,否則稱為“無限博弈”。
- 3.得失:一局博弈結(jié)局時(shí)的結(jié)果稱為得失酗洒。每個(gè)局中人在一局博弈結(jié)束時(shí)的得失但惶,不僅與該局中人自身所選擇的策略有關(guān),而且與全局中人所取定的一組策略有關(guān)漆枚。所以创译,一局博弈結(jié)束時(shí)每個(gè)局中人的“得失”是全體局中人所取定的一組策略的函數(shù),通常稱為支付(payoff)函數(shù)墙基。
- 4.對(duì)于博弈參與者來說软族,存在著一博弈結(jié)果 。
- 5.博弈涉及到均衡:均衡是平衡的意思残制,在經(jīng)濟(jì)學(xué)中立砸,均衡意即相關(guān)量處于穩(wěn)定值。在供求關(guān)系中初茶,某一商品市場如果在某一價(jià)格下颗祝,想以此價(jià)格買此商品的人均能買到,而想賣的人均能賣出纺蛆,此時(shí)我們就說吐葵,該商品的供求達(dá)到了均衡。所謂納什均衡桥氏,它是一穩(wěn)定的博弈結(jié)果温峭。
博弈論研究的假設(shè):
1.決策主體是理性的,最大化自己的利益字支;
2.完全理性是共同知識(shí)凤藏;
3.每個(gè)參與人被假定為對(duì)所處環(huán)境及其他參與者的行為形成正確信念與預(yù)期。
納什均衡
納什均衡(Nash Equilibrium):在一策略組合中堕伪,所有的參與者面臨這樣一種情況揖庄,當(dāng)其他人不改變策略時(shí),他此時(shí)的策略是最好的欠雌。也就是說蹄梢,此時(shí)如果他改變策略他的支付將會(huì)降低。在納什均衡點(diǎn)上富俄,每一個(gè)理性的參與者都不會(huì)有單獨(dú)改變策略的沖動(dòng)禁炒。納什均衡點(diǎn)存在性證明的前提是“博弈均衡偶”概念的提出而咆。所謂“均衡偶”是在二人零和博弈中,當(dāng)局中人A采取其最優(yōu)策略a幕袱,局中人B也采取其最優(yōu)策略b暴备,如果局中人仍采取b,而局中人A卻采取另一種策略a们豌,那么局中人A的支付不會(huì)超過他采取原來的策略a的支付涯捻。這一結(jié)果對(duì)局中人B亦是如此。
這樣望迎,“均衡偶”的明確定義為:一對(duì)策略a(屬于策略集A)和策略b(屬于策略集B)稱之為均衡偶障癌,對(duì)任一策略a(屬于策略集A)和策略b(屬于策略集B),總有:偶對(duì)(a擂煞,b) ≤ 偶對(duì)(a混弥,b) ≥偶對(duì)(a,b)对省。
對(duì)于非零和博弈也有如下定義:一對(duì)策略a(屬于策略集A)和策略b(屬于策略集B)稱為非零和博弈的均衡偶蝗拿,對(duì)任一策略a(屬于策略集A)和策略b(屬于策略集B),總有:對(duì)局中人A的偶對(duì)(a蒿涎,b) ≤偶對(duì)(a哀托,b);對(duì)局中人B的偶對(duì)(a,b)≤偶對(duì)(a劳秋,b)仓手。
有了上述定義,就立即得到納什定理:
任何具有有限純策略的二人博弈至少有一個(gè)均衡偶玻淑。這一均衡偶就稱為納什均衡點(diǎn)嗽冒。
納什定理的嚴(yán)格證明要用到不動(dòng)點(diǎn)理論,不動(dòng)點(diǎn)理論是經(jīng)濟(jì)均衡研究的主要工具补履。通俗地說添坊,尋找均衡點(diǎn)的存在性等價(jià)于找到博弈的不動(dòng)點(diǎn)。納什均衡點(diǎn)概念提供了一種非常重要的分析手段箫锤,使博弈論研究可以在一個(gè)博弈結(jié)構(gòu)里尋找比較有意義的結(jié)果贬蛙。但納什均衡點(diǎn)定義只局限于任何局中人不想單方面變換策略,而忽視了其他局中人改變策略的可能性谚攒,因此阳准,在很多情況下,納什均衡點(diǎn)的結(jié)論缺乏說服力馏臭,研究者們形象地稱之為“天真可愛的納什均衡點(diǎn)”野蝇。
塞爾頓(R·Selten)在多個(gè)均衡中剔除一些按照一定規(guī)則不合理的均衡點(diǎn),從而形成了兩個(gè)均衡的精煉概念:子博弈完全均衡和顫抖的手完美均衡。
案例
囚徒困境
在博弈論中绕沈,含有占優(yōu)戰(zhàn)略均衡的一個(gè)著名例子是由塔克給出的“囚徒困境”(prisoner's dilemma)博弈模型乱灵。該模型用一種特別的方式為我們講述了一個(gè)警察與小偷的故事。假設(shè)有兩個(gè)小偷A(chǔ)和B聯(lián)合犯事七冲、私入民宅被警察抓住。
警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊规婆,對(duì)每一個(gè)犯罪嫌疑人澜躺,警方給出的政策是:如果兩個(gè)犯罪嫌疑人都坦白了罪行,交出了贓物抒蚜,于是證據(jù)確鑿掘鄙,兩人都被判有罪,各被判刑8年嗡髓;如果只有一個(gè)犯罪嫌疑人坦白操漠,另一個(gè)人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年饿这,而坦白者有功被減刑8年浊伙,立即釋放。如果兩人都抵賴长捧,則警方因證據(jù)不足不能判兩人的偷竊罪嚣鄙,但可以私入民宅的罪名將兩人各判入獄1年。下表給出了這個(gè)博弈的支付矩陣串结。
A╲B | 坦白 | 抵賴 |
---|---|---|
坦白 | 8哑子,8 | 0,10 |
抵賴 | 10肌割,0 | 1卧蜓,1 |
對(duì)A來說,盡管他不知道B作何選擇把敞,但他知道無論B選擇什么弥奸,他選擇“坦白”總是最優(yōu)的。顯然先巴,根據(jù)對(duì)稱性其爵,B也會(huì)選擇“坦白”,結(jié)果是兩人都被判刑8年伸蚯。但是摩渺,倘若他們都選擇“抵賴”,每人只被判刑1年剂邮。在表2.2中的四種行動(dòng)選擇組合中摇幻,(抵賴、抵賴)是帕累托最優(yōu),因?yàn)槠x這個(gè)行動(dòng)選擇組合的任何其他行動(dòng)選擇組合都至少會(huì)使一個(gè)人的境況變差绰姻。但是枉侧,“坦白”是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略,而(坦白狂芋,坦白)是一個(gè)占優(yōu)戰(zhàn)略均衡榨馁,即納什均衡。不難看出帜矾,此處納什均衡與帕累托存在沖突翼虫。
單從數(shù)學(xué)角度講,這個(gè)理論是合理的屡萤,也就是選擇都坦白珍剑。但在這樣多維信息共同作用的社會(huì)學(xué)領(lǐng)域顯然是不合適的。正如中國古代將官員之間的行賄受賄稱為“陋規(guī)”而不是想方設(shè)法清查死陆,這是因?yàn)樯鐣?huì)體系給人行為的束縛作用迫使人的決策發(fā)生改變招拙。比如,從心理學(xué)角度講措译,選擇坦白的成本會(huì)更大别凤,一方坦白害得另一方加罪,那么事后的報(bào)復(fù)行為以及從而不會(huì)輕易在周圍知情人當(dāng)中的“出賣”角色將會(huì)使他損失更多领虹。
而8年到10年間的增加比例會(huì)被淡化闻妓,人的尊嚴(yán)會(huì)使人產(chǎn)生復(fù)仇情緒,略打破“行規(guī)”掠械。我們正處于大數(shù)據(jù)時(shí)代由缆,想更接近事實(shí)的處理一件事就要盡可能多地掌握相關(guān)資料并合理加權(quán)分析,人的活動(dòng)動(dòng)影像動(dòng)因復(fù)雜猾蒂,所以囚徒困境只能作為簡化模型參考均唉,具體決策還得具體分析。
智豬博弈
經(jīng)濟(jì)學(xué)中的“智豬博弈”(Pigs’payoffs) 肚菠,這個(gè)例子講的是:
假設(shè)豬圈里有一頭大豬舔箭、一頭小豬。豬圈的一頭有豬食槽蚊逢,另一頭安裝著控制豬食供應(yīng)的按鈕层扶,按一下按鈕會(huì)有10個(gè)單位的豬食進(jìn)槽,但是誰按按鈕就會(huì)首先付出2個(gè)單位的成本烙荷,若小豬先到槽邊镜会,大小豬吃到食物的收益比是6∶4;同時(shí)到槽邊终抽,大小豬收益比是7∶3戳表;大豬先到槽邊桶至,大小豬收益比是9∶1。那么匾旭,在兩頭豬都有智慧的前提下镣屹,最終結(jié)果是小豬選擇等待。
"智豬博弈"由納什于1950年提出价涝。實(shí)際上小豬選擇等待女蜈,讓大豬去按控制按鈕,而自己選擇“坐船”(或稱為搭便車)的原因很簡單:在大豬選擇行動(dòng)的前提下色瘩,小豬選擇等待的話鞭光,小豬可得到4個(gè)單位的純收益,而小豬行動(dòng)的話泞遗,則僅僅可以獲得大豬吃剩的1個(gè)單位的純收益,所以等待優(yōu)于行動(dòng)席覆;在大豬選擇等待的前提下史辙,小豬如果行動(dòng)的話,小豬的收入將不抵成本佩伤,純收益為-1單位聊倔,如果小豬也選擇等待的話,那么小豬的收益為零生巡,成本也為零耙蔑,總之,等待還是要優(yōu)于行動(dòng)孤荣。
用博弈論中的報(bào)酬矩陣可以更清晰的刻畫出小豬的選擇:
大豬/小豬 | 行動(dòng) | 等待 |
---|---|---|
行動(dòng) | 5甸陌,1 | 4,4 |
等待 | 9盐股,-1 | 0钱豁,0 |
從矩陣中可以看出,當(dāng)大豬選擇行動(dòng)的時(shí)候疯汁,小豬如果行動(dòng)牲尺,其收益是1,而小豬等待的話幌蚊,收益是4谤碳,所以小豬選擇等待;當(dāng)大豬選擇等待的時(shí)候溢豆,小豬如果行動(dòng)的話蜒简,其收益是-1,而小豬等待的話漩仙,收益是0臭蚁,所以小豬也選擇等待最铁。綜合來看,無論大豬是選擇行動(dòng)還是等待垮兑,小豬的選擇都將是等待冷尉,即等待是小豬的占優(yōu)策略。
在小企業(yè)經(jīng)營中系枪,學(xué)會(huì)如何“搭便車”是一個(gè)精明的職業(yè)經(jīng)理人最為基本的素質(zhì)雀哨。在某些時(shí)候,如果能夠注意等待私爷,讓其他大的企業(yè)首先開發(fā)市場雾棺,是一種明智的選擇。這時(shí)候有所不為才能有所為衬浑!
高明的管理者善于利用各種有利的條件來為自己服務(wù)捌浩。“搭便車”實(shí)際上是提供給職業(yè)經(jīng)理人面對(duì)每一項(xiàng)花費(fèi)的另一種選擇工秩,對(duì)它的留意和研究可以給企業(yè)節(jié)省很多不必要的費(fèi)用尸饺,從而使企業(yè)的管理和發(fā)展走上一個(gè)新的臺(tái)階。這種現(xiàn)象在經(jīng)濟(jì)生活中十分常見助币,卻很少為小企業(yè)的經(jīng)理人所熟識(shí)浪听。
在智豬博弈中,雖然小豬的“撿現(xiàn)成”的行為從道義上來講令人不齒眉菱,但是博弈策略的主要目的不正是使用謀略最大化自己的利益嗎迹栓?