博弈論

定義

博弈論是二人在平等的對(duì)局中各自利用對(duì)方的策略變換自己的對(duì)抗策略,達(dá)到取勝的目的嫌吠。

要素

博弈論有以下幾個(gè)要素:

  • 1.局中人:在一場競賽或博弈中,每一個(gè)有決策權(quán)的參與者成為一個(gè)局中人堵腹。只有兩個(gè)局中人的博弈現(xiàn)象稱為“兩人博弈”测萎,而多于兩個(gè)局中人的博弈稱為“多人博弈”闹伪。
  • 2.策略:一局博弈中沪铭,每個(gè)局中人都有選擇實(shí)際可行的完整的行動(dòng)方案壮池,即方案不是某階段的行動(dòng)方案,而是指導(dǎo)整個(gè)行動(dòng)的一個(gè)方案杀怠,一個(gè)局中人的一個(gè)可行的自始至終全局籌劃的一個(gè)行動(dòng)方案椰憋,稱為這個(gè)局中人的一個(gè)策略。如果在一局博弈中局中人都總共有有限個(gè)策略赔退,則稱為“有限博弈”,否則稱為“無限博弈”。
  • 3.得失:一局博弈結(jié)局時(shí)的結(jié)果稱為得失酗洒。每個(gè)局中人在一局博弈結(jié)束時(shí)的得失但惶,不僅與該局中人自身所選擇的策略有關(guān),而且與全局中人所取定的一組策略有關(guān)漆枚。所以创译,一局博弈結(jié)束時(shí)每個(gè)局中人的“得失”是全體局中人所取定的一組策略的函數(shù),通常稱為支付(payoff)函數(shù)墙基。
  • 4.對(duì)于博弈參與者來說软族,存在著一博弈結(jié)果 。
  • 5.博弈涉及到均衡:均衡是平衡的意思残制,在經(jīng)濟(jì)學(xué)中立砸,均衡意即相關(guān)量處于穩(wěn)定值。在供求關(guān)系中初茶,某一商品市場如果在某一價(jià)格下颗祝,想以此價(jià)格買此商品的人均能買到,而想賣的人均能賣出纺蛆,此時(shí)我們就說吐葵,該商品的供求達(dá)到了均衡。所謂納什均衡桥氏,它是一穩(wěn)定的博弈結(jié)果温峭。

博弈論研究的假設(shè):
1.決策主體是理性的,最大化自己的利益字支;
2.完全理性是共同知識(shí)凤藏;
3.每個(gè)參與人被假定為對(duì)所處環(huán)境及其他參與者的行為形成正確信念與預(yù)期。

納什均衡

納什均衡(Nash Equilibrium):在一策略組合中堕伪,所有的參與者面臨這樣一種情況揖庄,當(dāng)其他人不改變策略時(shí),他此時(shí)的策略是最好的欠雌。也就是說蹄梢,此時(shí)如果他改變策略他的支付將會(huì)降低。在納什均衡點(diǎn)上富俄,每一個(gè)理性的參與者都不會(huì)有單獨(dú)改變策略的沖動(dòng)禁炒。納什均衡點(diǎn)存在性證明的前提是“博弈均衡偶”概念的提出而咆。所謂“均衡偶”是在二人零和博弈中,當(dāng)局中人A采取其最優(yōu)策略a幕袱,局中人B也采取其最優(yōu)策略b暴备,如果局中人仍采取b,而局中人A卻采取另一種策略a们豌,那么局中人A的支付不會(huì)超過他采取原來的策略a的支付涯捻。這一結(jié)果對(duì)局中人B亦是如此。
這樣望迎,“均衡偶”的明確定義為:一對(duì)策略a(屬于策略集A)和策略b(屬于策略集B)稱之為均衡偶障癌,對(duì)任一策略a(屬于策略集A)和策略b(屬于策略集B),總有:偶對(duì)(a擂煞,b) ≤ 偶對(duì)(a混弥,b) ≥偶對(duì)(a,b)对省。
對(duì)于非零和博弈也有如下定義:一對(duì)策略a(屬于策略集A)和策略b(屬于策略集B)稱為非零和博弈的均衡偶蝗拿,對(duì)任一策略a(屬于策略集A)和策略b(屬于策略集B),總有:對(duì)局中人A的偶對(duì)(a蒿涎,b) ≤偶對(duì)(a哀托,b);對(duì)局中人B的偶對(duì)(a,b)≤偶對(duì)(a劳秋,b)仓手。
有了上述定義,就立即得到納什定理:
任何具有有限純策略的二人博弈至少有一個(gè)均衡偶玻淑。這一均衡偶就稱為納什均衡點(diǎn)嗽冒。
納什定理的嚴(yán)格證明要用到不動(dòng)點(diǎn)理論,不動(dòng)點(diǎn)理論是經(jīng)濟(jì)均衡研究的主要工具补履。通俗地說添坊,尋找均衡點(diǎn)的存在性等價(jià)于找到博弈的不動(dòng)點(diǎn)。納什均衡點(diǎn)概念提供了一種非常重要的分析手段箫锤,使博弈論研究可以在一個(gè)博弈結(jié)構(gòu)里尋找比較有意義的結(jié)果贬蛙。但納什均衡點(diǎn)定義只局限于任何局中人不想單方面變換策略,而忽視了其他局中人改變策略的可能性谚攒,因此阳准,在很多情況下,納什均衡點(diǎn)的結(jié)論缺乏說服力馏臭,研究者們形象地稱之為“天真可愛的納什均衡點(diǎn)”野蝇。
塞爾頓(R·Selten)在多個(gè)均衡中剔除一些按照一定規(guī)則不合理的均衡點(diǎn),從而形成了兩個(gè)均衡的精煉概念:子博弈完全均衡和顫抖的手完美均衡。

案例

囚徒困境

在博弈論中绕沈,含有占優(yōu)戰(zhàn)略均衡的一個(gè)著名例子是由塔克給出的“囚徒困境”(prisoner's dilemma)博弈模型乱灵。該模型用一種特別的方式為我們講述了一個(gè)警察與小偷的故事。假設(shè)有兩個(gè)小偷A(chǔ)和B聯(lián)合犯事七冲、私入民宅被警察抓住。
警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊规婆,對(duì)每一個(gè)犯罪嫌疑人澜躺,警方給出的政策是:如果兩個(gè)犯罪嫌疑人都坦白了罪行,交出了贓物抒蚜,于是證據(jù)確鑿掘鄙,兩人都被判有罪,各被判刑8年嗡髓;如果只有一個(gè)犯罪嫌疑人坦白操漠,另一個(gè)人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年饿这,而坦白者有功被減刑8年浊伙,立即釋放。如果兩人都抵賴长捧,則警方因證據(jù)不足不能判兩人的偷竊罪嚣鄙,但可以私入民宅的罪名將兩人各判入獄1年。下表給出了這個(gè)博弈的支付矩陣串结。

A╲B 坦白 抵賴
坦白 8哑子,8 0,10
抵賴 10肌割,0 1卧蜓,1

對(duì)A來說,盡管他不知道B作何選擇把敞,但他知道無論B選擇什么弥奸,他選擇“坦白”總是最優(yōu)的。顯然先巴,根據(jù)對(duì)稱性其爵,B也會(huì)選擇“坦白”,結(jié)果是兩人都被判刑8年伸蚯。但是摩渺,倘若他們都選擇“抵賴”,每人只被判刑1年剂邮。在表2.2中的四種行動(dòng)選擇組合中摇幻,(抵賴、抵賴)是帕累托最優(yōu),因?yàn)槠x這個(gè)行動(dòng)選擇組合的任何其他行動(dòng)選擇組合都至少會(huì)使一個(gè)人的境況變差绰姻。但是枉侧,“坦白”是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略,而(坦白狂芋,坦白)是一個(gè)占優(yōu)戰(zhàn)略均衡榨馁,即納什均衡。不難看出帜矾,此處納什均衡與帕累托存在沖突翼虫。
單從數(shù)學(xué)角度講,這個(gè)理論是合理的屡萤,也就是選擇都坦白珍剑。但在這樣多維信息共同作用的社會(huì)學(xué)領(lǐng)域顯然是不合適的。正如中國古代將官員之間的行賄受賄稱為“陋規(guī)”而不是想方設(shè)法清查死陆,這是因?yàn)樯鐣?huì)體系給人行為的束縛作用迫使人的決策發(fā)生改變招拙。比如,從心理學(xué)角度講措译,選擇坦白的成本會(huì)更大别凤,一方坦白害得另一方加罪,那么事后的報(bào)復(fù)行為以及從而不會(huì)輕易在周圍知情人當(dāng)中的“出賣”角色將會(huì)使他損失更多领虹。
而8年到10年間的增加比例會(huì)被淡化闻妓,人的尊嚴(yán)會(huì)使人產(chǎn)生復(fù)仇情緒,略打破“行規(guī)”掠械。我們正處于大數(shù)據(jù)時(shí)代由缆,想更接近事實(shí)的處理一件事就要盡可能多地掌握相關(guān)資料并合理加權(quán)分析,人的活動(dòng)動(dòng)影像動(dòng)因復(fù)雜猾蒂,所以囚徒困境只能作為簡化模型參考均唉,具體決策還得具體分析。

智豬博弈

經(jīng)濟(jì)學(xué)中的“智豬博弈”(Pigs’payoffs) 肚菠,這個(gè)例子講的是:
假設(shè)豬圈里有一頭大豬舔箭、一頭小豬。豬圈的一頭有豬食槽蚊逢,另一頭安裝著控制豬食供應(yīng)的按鈕层扶,按一下按鈕會(huì)有10個(gè)單位的豬食進(jìn)槽,但是誰按按鈕就會(huì)首先付出2個(gè)單位的成本烙荷,若小豬先到槽邊镜会,大小豬吃到食物的收益比是6∶4;同時(shí)到槽邊终抽,大小豬收益比是7∶3戳表;大豬先到槽邊桶至,大小豬收益比是9∶1。那么匾旭,在兩頭豬都有智慧的前提下镣屹,最終結(jié)果是小豬選擇等待。
"智豬博弈"由納什于1950年提出价涝。實(shí)際上小豬選擇等待女蜈,讓大豬去按控制按鈕,而自己選擇“坐船”(或稱為搭便車)的原因很簡單:在大豬選擇行動(dòng)的前提下色瘩,小豬選擇等待的話鞭光,小豬可得到4個(gè)單位的純收益,而小豬行動(dòng)的話泞遗,則僅僅可以獲得大豬吃剩的1個(gè)單位的純收益,所以等待優(yōu)于行動(dòng)席覆;在大豬選擇等待的前提下史辙,小豬如果行動(dòng)的話,小豬的收入將不抵成本佩伤,純收益為-1單位聊倔,如果小豬也選擇等待的話,那么小豬的收益為零生巡,成本也為零耙蔑,總之,等待還是要優(yōu)于行動(dòng)孤荣。
用博弈論中的報(bào)酬矩陣可以更清晰的刻畫出小豬的選擇:

大豬/小豬 行動(dòng) 等待
行動(dòng) 5甸陌,1 4,4
等待 9盐股,-1 0钱豁,0

從矩陣中可以看出,當(dāng)大豬選擇行動(dòng)的時(shí)候疯汁,小豬如果行動(dòng)牲尺,其收益是1,而小豬等待的話幌蚊,收益是4谤碳,所以小豬選擇等待;當(dāng)大豬選擇等待的時(shí)候溢豆,小豬如果行動(dòng)的話蜒简,其收益是-1,而小豬等待的話漩仙,收益是0臭蚁,所以小豬也選擇等待最铁。綜合來看,無論大豬是選擇行動(dòng)還是等待垮兑,小豬的選擇都將是等待冷尉,即等待是小豬的占優(yōu)策略。
在小企業(yè)經(jīng)營中系枪,學(xué)會(huì)如何“搭便車”是一個(gè)精明的職業(yè)經(jīng)理人最為基本的素質(zhì)雀哨。在某些時(shí)候,如果能夠注意等待私爷,讓其他大的企業(yè)首先開發(fā)市場雾棺,是一種明智的選擇。這時(shí)候有所不為才能有所為衬浑!
高明的管理者善于利用各種有利的條件來為自己服務(wù)捌浩。“搭便車”實(shí)際上是提供給職業(yè)經(jīng)理人面對(duì)每一項(xiàng)花費(fèi)的另一種選擇工秩,對(duì)它的留意和研究可以給企業(yè)節(jié)省很多不必要的費(fèi)用尸饺,從而使企業(yè)的管理和發(fā)展走上一個(gè)新的臺(tái)階。這種現(xiàn)象在經(jīng)濟(jì)生活中十分常見助币,卻很少為小企業(yè)的經(jīng)理人所熟識(shí)浪听。
在智豬博弈中,雖然小豬的“撿現(xiàn)成”的行為從道義上來講令人不齒眉菱,但是博弈策略的主要目的不正是使用謀略最大化自己的利益嗎迹栓?

就說到這了,有什么不對(duì)的地方俭缓,歡迎指正克伊,有什么沒說全的,歡迎討論留言

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末华坦,一起剝皮案震驚了整個(gè)濱河市答毫,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌季春,老刑警劉巖洗搂,帶你破解...
    沈念sama閱讀 219,427評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異载弄,居然都是意外死亡耘拇,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門宇攻,熙熙樓的掌柜王于貴愁眉苦臉地迎上來惫叛,“玉大人,你說我怎么就攤上這事逞刷〖斡浚” “怎么了妻熊?”我有些...
    開封第一講書人閱讀 165,747評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長仑最。 經(jīng)常有香客問我扔役,道長,這世上最難降的妖魔是什么警医? 我笑而不...
    開封第一講書人閱讀 58,939評(píng)論 1 295
  • 正文 為了忘掉前任亿胸,我火速辦了婚禮,結(jié)果婚禮上预皇,老公的妹妹穿的比我還像新娘侈玄。我一直安慰自己,他們只是感情好吟温,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,955評(píng)論 6 392
  • 文/花漫 我一把揭開白布序仙。 她就那樣靜靜地躺著,像睡著了一般鲁豪。 火紅的嫁衣襯著肌膚如雪潘悼。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,737評(píng)論 1 305
  • 那天呈昔,我揣著相機(jī)與錄音,去河邊找鬼友绝。 笑死堤尾,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的迁客。 我是一名探鬼主播郭宝,決...
    沈念sama閱讀 40,448評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼掷漱!你這毒婦竟也來了粘室?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,352評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤卜范,失蹤者是張志新(化名)和其女友劉穎衔统,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體海雪,經(jīng)...
    沈念sama閱讀 45,834評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡锦爵,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,992評(píng)論 3 338
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了奥裸。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片险掀。...
    茶點(diǎn)故事閱讀 40,133評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖湾宙,靈堂內(nèi)的尸體忽然破棺而出樟氢,到底是詐尸還是另有隱情冈绊,我是刑警寧澤,帶...
    沈念sama閱讀 35,815評(píng)論 5 346
  • 正文 年R本政府宣布埠啃,位于F島的核電站死宣,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏霸妹。R本人自食惡果不足惜十电,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,477評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望叹螟。 院中可真熱鬧鹃骂,春花似錦、人聲如沸罢绽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽良价。三九已至寝殴,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間明垢,已是汗流浹背蚣常。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評(píng)論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留痊银,地道東北人抵蚊。 一個(gè)月前我還...
    沈念sama閱讀 48,398評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像溯革,于是被迫代替她去往敵國和親贞绳。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,077評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 大家早安致稀、午安冈闭、晚安,今天我先從機(jī)器學(xué)習(xí)的學(xué)習(xí)中休息一下抖单,來了解一些常見的博弈論模型萎攒,然后繼續(xù)學(xué)習(xí)機(jī)器學(xué)習(xí)等。以下...
    keepStriving閱讀 46,676評(píng)論 3 72
  • 博弈論(Game Theory)矛绘,博弈論是指研究多個(gè)個(gè)體或團(tuán)隊(duì)之間在特定條件制約下的對(duì)局中利用相關(guān)方的策略躺酒,而實(shí)施...
    鮑廷俊閱讀 2,106評(píng)論 0 0
  • 如果想觀看相關(guān)視頻可以在西瓜視頻(賬號(hào)zidea)或者嗶哩嗶哩(賬號(hào)zidea2015)找到我發(fā)布視頻解說,注意頭...
    zidea閱讀 1,633評(píng)論 0 4
  • 如果想觀看相關(guān)視頻可以在西瓜視頻(賬號(hào)zidea)或者嗶哩嗶哩(賬號(hào)zidea2015)找到我發(fā)布視頻解說蔑歌,注意頭...
    zidea閱讀 4,090評(píng)論 0 9
  • 思考有五個(gè)海盜羹应,劫了100兩金子要分贓。他們的分贓辦法是抓鬮決定:抓到第一個(gè)鬮的海盜次屠,可以先提出一個(gè)分配方案园匹,如果...
    為了自由去成長閱讀 2,032評(píng)論 2 8