帕累托最優(yōu)與納什均衡

博弈論(Game Theory)

博弈論研究的是"理性人"之間的博弈

現(xiàn)在流行“行為經(jīng)濟學(xué)”擦剑,人們愛說人是非理性的悼瘾,連有的學(xué)經(jīng)濟學(xué)的人都不敢理直氣壯地說經(jīng)濟學(xué)假設(shè)人是理性的了。但是地道的經(jīng)濟學(xué)必須得假設(shè)人是理性的忙厌,如果人不是理性的,所有數(shù)學(xué)模型、包括供求關(guān)系之類的基本結(jié)論就都灰飛煙滅了淹冰。

人的確經(jīng)常表現(xiàn)得不理性,但經(jīng)濟學(xué)的理性人假設(shè)并不算錯巨柒。這是因為人在做熟悉的事情樱拴、重要的事情柠衍、涉及到錢的事情的時候,通常是相當(dāng)理性的[1]晶乔。而這些事情恰恰是經(jīng)濟學(xué)珍坊、也是博弈論的研究對象。博弈論假設(shè)人是理性的正罢,表現(xiàn)為三個要求阵漏。

第一,你得知道你想要什么翻具,并且對你想要的東西有一個明確的排序履怯。

第二,你的行動是在一定的規(guī)則之下裆泳,爭取得到你想要的東西叹洲。

第三,你知道對手也是這么想的工禾,而且對手也知道這些規(guī)則运提。

這三個要求都很簡單,但是我們得承認(rèn)闻葵,有些人在有些時候真做不到民泵。比如說前段新聞中的“高鐵霸座男”,他是個博士槽畔,我覺得你要是問他是個人的形象和聲譽重要還是一個座位重要洪灯,他會更想要形象和聲譽 —— 可是在高鐵上那一刻,他的情緒戰(zhàn)勝了理智竟痰。人有時候會被某種情緒劫持签钩,這種情況不是博弈論的研究內(nèi)容。

但如果一個人長期這么做事坏快,其中可能就有理性的成分铅檩。比如現(xiàn)在一個熱門話題是老年人容易上當(dāng)受騙,買一些不靠譜的保健品莽鸿。這些老人都是非理性的嗎昧旨?不一定。那些推銷保健品的人賣的并不僅僅保健品祥得,同時也是一種情感服務(wù)兔沃,比如認(rèn)干爹干媽之類。老人未必不知道保健品沒啥用级及,但是老人可能認(rèn)為反正吃保健品也沒什么壞處乒疏,他花點錢滿足一下情感需求未嘗不可。

如果一個現(xiàn)象長期存在饮焦,那就有可能是博弈論的研究內(nèi)容 —— 博弈論稱之為“均衡”怕吴。再比如說窍侧,像百度、莆田系醫(yī)院转绷、拼多多APP這些東西伟件,充斥著假貨和騙局,為什么能長期存在呢议经?也許這就是當(dāng)今中國的博弈格局所決定的斧账,這個結(jié)果可能是各方的理性選擇。

博弈論的用處

因為要求各方是充分理性的煞肾,有時候博弈論會得出一些非常怪的結(jié)論其骄。

比如你可能聽說過這個故事。老師讓全班所有同學(xué)都想一個數(shù)字扯旷,說誰想的數(shù)字最接近全班平均值的2/3拯爽,誰就獲勝。那如果我們假定所有同學(xué)都足夠聰明的話钧忽,正確答案應(yīng)該是0毯炮。這是因為不管你猜測全班人的共識是多少,你都會把這個共識乘以2/3 —— 但別人也能想到這一點耸黑,他們也會把你的數(shù)字再乘以2/3……你們的每一步推理都會讓共識變得越來越小桃煎。而事實上哪個大學(xué)的學(xué)生都不會得出這么極端的答案來。

生活中絕大多數(shù)人不會聰明到那個程度大刊,去做那種極端的推理为迈。那難道說博弈論真的沒用嗎?博弈論的實際應(yīng)用缺菌,并不是這種數(shù)學(xué)謎題葫辐。

博弈論能幫助我們理解長期存在的各種現(xiàn)象。如果你觀察到社會上有很多不合理的現(xiàn)象伴郁,而這些現(xiàn)象還長期存在耿战,你會認(rèn)為這是因為社會上的人都太愚蠢了嗎?博弈論會讓你考察現(xiàn)象背后的博弈規(guī)則焊傅。

當(dāng)然剂陡,這絕對不是說可以理解的現(xiàn)象就"應(yīng)該"長期存在。博弈論更重要的作用狐胎,是告訴我們?nèi)绾胃淖儾缓玫木置妗?/b>可能這個壞局面是因為博弈是單次的鸭栖,可能其中有信息不完全的問題,可能是因為那個許諾不可信∥粘玻現(xiàn)在博弈論已經(jīng)能夠提供各種工具晕鹊,幫我們達(dá)成更好的局面。

我認(rèn)為人們之所以用不上博弈論,是因為缺少識別博弈格局的眼光和改變博弈規(guī)則的意識捏题。

對個人來說,最起碼的一點肉渴,你應(yīng)該時刻提醒自己要理性公荧。研究博弈論就好像下棋一樣,你要考慮你的每一個行動都是有后果的同规,你要事先想好對方會有什么反應(yīng)循狰,然后你再怎么應(yīng)對,然后對方再反應(yīng)……一直到最后是個什么結(jié)果券勺。

而我覺得一個更深層的意識是绪钥,你應(yīng)該首先做一個“Player”。Player关炼,在游戲中叫玩家程腹,在體育比賽中叫選手,在博弈論中叫參與者 —— 其實都是一個意思儒拂,博弈論(Game Theory)說的都是 game寸潦。有一點參與游戲的精神,你就有權(quán)在規(guī)則范圍內(nèi)采取對自己最有利的行動社痛,你就是積極主動的见转,你就會平等對待對手 —— 你就既不是一個渾渾噩噩整天根據(jù)別人設(shè)定做事的人,也不會有整個世界繞著自己轉(zhuǎn)的幻覺蒜哀。

帕累托最優(yōu)(Pareto Optimality)

為什么商家總扎堆斩箫?

你注意到?jīng)]有,同一類商家總愛聚集在一起撵儿。偏一點的地方什么都沒有乘客,熱門地段卻有好多同樣的店,一個十字路口竟然會有兩家加油站淀歇。新聞媒體也是這樣寨典,一有什么重大事件或者熱門電視劇,你打開電視所有頻道都是這個內(nèi)容房匆。從消費者的角度耸成,我們希望加油站更分散一點,讓所有人都能就近使用浴鸿。我們希望產(chǎn)品有更多的差異化井氢。那為什么商家非得扎堆呢?

用博弈論思考岳链,這并不是商家都盲從花竞、只知道互相模仿,而是他們不得不這樣。博弈論要求你必須考慮競爭對手會怎么做约急。

咱們把問題簡化一下[2]零远。設(shè)想有一個比較長海灘,你要在海灘上擺個攤賣冰激凌厌蔽。你應(yīng)該把攤放在哪里呢牵辣?如果整個海灘只有你一家冰激凌攤,那你擺哪里都可以奴饮。但是考慮到可能將來會有競爭對手纬向,你就應(yīng)該把冰激凌攤擺在中間!這是因為如果你擺的位置比如說偏右戴卜,對手來了只要往中間區(qū)域一擺逾条,他輻射的勢力范圍就絕對大于你。


嚴(yán)格地說投剥,如果你的位置在 k师脂,競爭對手在 -k 和 k 之間任選一點都比你好。好江锨,現(xiàn)在作為先來者你已經(jīng)把攤位擺在了中間危彩。那如果新來了一個競爭者,他應(yīng)該把冰激凌攤擺哪兒呢泳桦?如果他的位置靠右汤徽,的確能夠獨占他右邊的市場,但是那也就等于把從你倆中間開始算灸撰,左邊超過一半的海灘都拱手讓給你了谒府。所以沒辦法,他也只能把攤位放在中間浮毯,只有這樣才能跟你平等競爭完疫。

這就是為什么要扎堆≌叮可是我們想想壳鹤,如果兩家事先商量好,分散開饰迹,在海灘上1/4和3/4這兩個位置分別擺攤芳誓,其實還是兩家平等賺錢,而且還能確保消費者買冰激凌的走動距離最短啊鸭。這樣多好呢锹淌?


從扎堆到分散的這個改進,兩個商家的利益都沒有受損赠制,而消費者的境遇更好了赂摆,所以可以稱得上是“帕累托改進”。帕累托是一位意大利經(jīng)濟學(xué)家,帕累托改進的意思是這個改進能在不傷害任何一個人利益的同時烟号,使得至少一個人的境遇變得更好绊谭。如果一個局面已經(jīng)好到?jīng)]有帕累托改進的余地了,這個局面就叫“帕累托最優(yōu)”汪拥。

一個理想的达传、令人快意的世界應(yīng)該是帕累托最優(yōu)的。扎堆顯然不是帕累托最優(yōu)喷楣,分散才是帕累托最優(yōu)趟大。那為什么博弈的結(jié)果不是帕累托最優(yōu)的呢鹤树?因為在這場博弈中铣焊,帕累托最優(yōu)是個*不穩(wěn)定*的局面。就算一開始兩家商量好了分散擺攤罕伯,將來也會有一家偷偷地轉(zhuǎn)移到中間去曲伊!他這么做不是帕累托改進,因為會傷害對手和消費者的利益 —— 但是這么做對他自己很有利追他。

理想青年喜歡帕累托最優(yōu)坟募,但是博弈論告訴我們只有穩(wěn)定的局面才能長久存在。


納什均衡(Nash Equilibrium)

囚徒困境

你可能已經(jīng)非常熟悉“囚徒困境”的故事了邑狸,但是因為從這個故事里能得出特別重要的概念懈糯,這里值得專門講一遍。

有兩個小偷被警察抓住了单雾,但是警察手里并沒有過硬的證據(jù)赚哗,只能指望口供。警察開出的條件是如果兩個人都招供硅堆,那就都判刑3年屿储;如果有一個人招供,另一個人不招供渐逃,那么招供的人就算立功够掠,可以無罪釋放,而不招供的人就要嚴(yán)懲茄菊,判刑5年疯潭;如果兩個人都不招供,因為證據(jù)有限面殖,所有兩個人都判刑1年袁勺。警察不準(zhǔn)兩人通氣,都是單獨審訊畜普。

咱們別管什么正義和邪惡期丰,咱們幫這兩個囚徒分析一下博弈策略。首先我們要把不同策略和結(jié)果畫在下面這張矩陣圖里。這種畫法是美國經(jīng)濟學(xué)家托馬斯·謝林發(fā)明的钝荡,謝林曾經(jīng)開玩笑說發(fā)明矩陣圖是他對博弈論所做最大的貢獻 ——


矩陣邊上是兩個人采取的策略街立,中間是各種策略組合帶給兩人的回報。你一眼就能看出來埠通,最好的結(jié)果是兩個人都不招供赎离,然后都被判一年。

但是博弈論要求我們每次做判斷都要考慮對方 —— 不是考慮怎么對對方好端辱,而是考慮對方會怎么做梁剔,然后你怎么做。對囚徒1來說舞蔽,如果對方招供了荣病,他就只能招供,因為不招供判5年招供判3年渗柿「雠瑁可是如果對方不招供,他還是應(yīng)該招供 —— 因為他招供就是立功朵栖,可以直接走人颊亮。也就是說,不管對方是招供還是不招供陨溅,囚徒1最好的策略都是招供终惑。

這就引出了我們要說的第二個概念,叫做“壓倒性策略(Dominant Strategy)”门扇。這個策略壓倒其他一切策略雹有,不管對手怎么做,這個策略對你來說都是最好的悯嗓。反過來說件舵,不招供,對囚徒1來說則是一個“被壓倒性策略(Dominated Strategy)”脯厨,也就是不管別人怎么做铅祸,你這么做對你都是不好的。

作為理性的人合武,如果博弈中有壓倒性策略临梗,你就一定要選擇這個策略。任何情況下都不要選擇被壓倒性策略稼跳。囚徒1的壓倒性策略是招供盟庞,囚徒2當(dāng)然也是如此。結(jié)果就是兩個人都被判刑3年汤善。這個結(jié)果可不是帕累托最優(yōu)什猖。但這個結(jié)果是*穩(wěn)定*的票彪。這表現(xiàn)在任何一方都絕對不會單方面改變策略。這就引出了我們要說的最重要概念:納什均衡不狮。換句話說就是不管我們喜不喜歡降铸,這個局面我們認(rèn)了。關(guān)鍵詞是“單方面”摇零。是推掸,如果咱倆都不招供會更好,可是要變必須得一起變驻仅,我自己不可能*先*變谅畅。因為人人都不愿意先變,結(jié)果這個局面就變不了噪服。

諾貝爾經(jīng)濟學(xué)獎得主羅杰·梅爾森有句話說毡泻,納什均衡對經(jīng)濟學(xué)的意義,就如同發(fā)現(xiàn)DNA雙螺旋結(jié)構(gòu)對生物學(xué)的意義那么重大芯咧!我理解這就是因為納什均衡給了我們一個觀察世界的眼光牙捉。

前面說的扎堆擺攤就是一個納什均衡竹揍。如果一個現(xiàn)象能夠在社會中長期穩(wěn)定地存在敬飒,它對參與的各方來說就一定是個納什均衡。納什均衡告訴我們評價一個局面不能只看它是不是對整體最好芬位,它必須得讓每個參與者都不愿意單方面改變才行无拗。

比如你要跟人簽個協(xié)議,如果你希望這個協(xié)議能被各方遵守昧碉,那它就必須得是一個納什均衡英染。一個制度哪怕再好,如果不是納什均衡就不會被遵守被饿。一個制度哪怕再不好四康,如果是納什均衡就會長久存在。

小結(jié)

不知道看到這里會不會讓你感到有點悲觀狭握。帕累托最優(yōu)常常不是納什均衡闪金。

理想青年喜歡帕累托最優(yōu),理性青年尋找納什均衡论颅。理想青年對應(yīng)試教育義憤填膺哎垦,理性青年知道只要高校還在看高考、教育就只能應(yīng)試下去恃疯;理想青年對黃牛票販咬牙切齒漏设,理性青年明白只要價格還在被管制、人們就只能用非價格的方式競爭下去今妄;理想青年對學(xué)區(qū)房表示不解郑口,理性青年表示只要入學(xué)還在劃片區(qū)鸳碧、再想付學(xué)費也只能以買房的方式付出去;理想青年對大組織政治攤手搖頭犬性,理性青年懂得只要遵章守紀(jì)還能繼續(xù)混下去杆兵、人們就不會有所忌憚更不會有革新的動力;

所以你指望理想青年的攤手搖頭仔夺、疑惑不解琐脏、咬牙切齒、義憤填膺能改變什么缸兔?他們甚至連真正要改變的是什么日裙,都沒弄明白,便急著感慨惰蜜。理想青年為帕累托最優(yōu)振臂高呼昂拂、聲嘶力竭、表演完畢憤然離席抛猖,理性青年卻在為改變納什均衡而“沒有原則”地輾轉(zhuǎn)騰挪格侯、日拱一卒、改變規(guī)則财著。


參考文獻

[1] 關(guān)于理性和行為經(jīng)濟學(xué)联四,David Levine 的 Is Behavioral Economics Doomed? The Ordinary versus the Extraordinary(2012)

[2] 這個例子來自 Presh Talwalkar, The Joy of Game Theory: An Introduction to Strategic Thinking (2014).

[3]全文整理至萬維鋼精英日課第三季

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市撑教,隨后出現(xiàn)的幾起案子朝墩,更是在濱河造成了極大的恐慌,老刑警劉巖伟姐,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件收苏,死亡現(xiàn)場離奇詭異,居然都是意外死亡愤兵,警方通過查閱死者的電腦和手機鹿霸,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來秆乳,“玉大人懦鼠,你說我怎么就攤上這事〗靡模” “怎么了葛闷?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長双藕。 經(jīng)常有香客問我淑趾,道長,這世上最難降的妖魔是什么忧陪? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任扣泊,我火速辦了婚禮近范,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘延蟹。我一直安慰自己评矩,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布阱飘。 她就那樣靜靜地躺著斥杜,像睡著了一般。 火紅的嫁衣襯著肌膚如雪沥匈。 梳的紋絲不亂的頭發(fā)上蔗喂,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天,我揣著相機與錄音高帖,去河邊找鬼缰儿。 笑死,一個胖子當(dāng)著我的面吹牛散址,可吹牛的內(nèi)容都是我干的乖阵。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼预麸,長吁一口氣:“原來是場噩夢啊……” “哼瞪浸!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起师崎,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤默终,失蹤者是張志新(化名)和其女友劉穎钓觉,沒想到半個月后妇智,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體婶熬,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年床估,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片诱渤。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡丐巫,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出勺美,到底是詐尸還是另有隱情递胧,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布赡茸,位于F島的核電站缎脾,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏占卧。R本人自食惡果不足惜遗菠,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一联喘、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧辙纬,春花似錦豁遭、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至譬涡,卻和暖如春蜈抓,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背昂儒。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工沟使, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人渊跋。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓腊嗡,卻偏偏與公主長得像,于是被迫代替她去往敵國和親拾酝。 傳聞我的和親對象是個殘疾皇子燕少,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內(nèi)容