納什均衡用百度百科的解釋就是"納什平衡(Nash equilibrium)责蝠,又稱為非合作博弈均衡丁稀,是博弈論的一個(gè)重要術(shù)語(yǔ)辆脸,以約翰·納什命名克握。在一個(gè)博弈過(guò)程中蕾管,無(wú)論對(duì)方的策略選擇如何,當(dāng)事人一方都會(huì)選擇某個(gè)確定的策略菩暗,則該策略被稱作支配性策略掰曾。如果兩個(gè)博弈的當(dāng)事人的策略組合分別構(gòu)成各自的支配性策略,那么這個(gè)組合就被定義為納什平衡勋眯。
很顯然用百度百科的解釋有點(diǎn)復(fù)雜婴梧,看過(guò)《五分鐘商學(xué)院》關(guān)于納什均衡潤(rùn)總是這樣通俗的解釋的“簡(jiǎn)單來(lái)說(shuō),納什均衡就是一種博弈的穩(wěn)定結(jié)果客蹋,誰(shuí)單方面改變策略塞蹭,誰(shuí)就會(huì)損失。換句話說(shuō)讶坯,如果在一個(gè)策略組合上番电,當(dāng)所有其他人都不改變策略時(shí),沒(méi)有人會(huì)改變自己的策略辆琅,則該策略組合就是一個(gè)納什均衡漱办。為了讓大家更好的理解納什均衡,下面舉例說(shuō)明婉烟,讓大家更容易理解娩井。
例1:市場(chǎng)上有2家企業(yè)A和B,都在同一個(gè)地區(qū)從事地產(chǎn)開(kāi)發(fā)似袁,房子的單方成本都是10000元錢洞辣,A和B都賣15000塊錢。有一天A降價(jià)到14000昙衅,于是A銷量大增扬霜,B銷量大減。B看到了后而涉,降價(jià)到13000著瓶,于是B銷量大增,A銷量大減啼县。但如果價(jià)格戰(zhàn)一直這樣打下去材原,對(duì)誰(shuí)也沒(méi)有好處沸久,于是A也選擇降價(jià)到13000,和B一樣华糖。B看到了A降價(jià)到13000麦向,B既不敢漲價(jià),也不敢降價(jià)客叉。漲價(jià)了市場(chǎng)就丟了诵竭,降價(jià)了,就賺不到錢甚至賠錢兼搏。所以A和B都不會(huì)再去做改變卵慰,這就是納什均衡。
例二:經(jīng)典案例 囚徒困境
假設(shè)有兩個(gè)小偷A(chǔ)和B聯(lián)合犯事佛呻、私入民宅被警察抓住裳朋。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊,對(duì)每一個(gè)犯罪嫌 疑人吓著,警方給出的政策是:如果一個(gè)犯罪嫌疑人坦白了罪行鲤嫡,交出了贓物,于是證據(jù)確鑿绑莺,兩人都被判有罪暖眼。如果另一個(gè)犯罪嫌疑人也作了坦白,則兩人各被判刑8 年纺裁。如果另一個(gè)犯罪嫌人沒(méi)有坦白而是抵賴诫肠,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年欺缘,立即釋放栋豫。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪谚殊,但可以私入民宅的罪名將兩人各判入獄1年丧鸯。
關(guān)于案例,顯然最好的策略是雙方都抵賴嫩絮,結(jié)果是大家都只被判1年丛肢。但是由于兩人處于隔離的情況,首先應(yīng)該是從心理學(xué)的角度來(lái)看絮记,當(dāng)事雙方都會(huì)懷疑對(duì)方會(huì)出賣自己以求自保摔踱、其次才是亞當(dāng)·斯密的理論虐先,假設(shè)每個(gè)人都是“理性的經(jīng)濟(jì)人”怨愤,都會(huì)從利己的目的出發(fā)進(jìn)行選擇。這兩個(gè)人都會(huì)有這樣一個(gè)盤算過(guò)程:
假如他坦白蛹批,如果我抵賴撰洗,得坐10年監(jiān)獄篮愉,如果我坦白最多才8年;假如他要是抵賴差导,如果我也抵賴试躏,我就會(huì)被判一年,如果我坦白就可以被釋放设褐,而他會(huì)坐10年牢颠蕴。綜合以上幾種情況考慮,不管他坦白與否助析,對(duì)我而言都是坦白了劃算犀被。兩個(gè)人都會(huì)動(dòng)這 樣的腦筋,最終外冀,兩個(gè)人都選擇了坦白寡键,結(jié)果都被判8年刑期。
基于經(jīng)濟(jì)學(xué)中Rational agent的前提假設(shè)雪隧,兩個(gè)囚犯符合自己利益的選擇是坦白招供西轩,原本對(duì)雙方都有利的策略不招供從而均被判處一年就不會(huì)出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判8年的結(jié)局脑沿,納什均衡”首先對(duì)亞當(dāng)·斯密的“看不見(jiàn)的手”的原理提出挑戰(zhàn):按照斯密的理論藕畔,在市場(chǎng)經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā)捅伤,而最終全社會(huì)達(dá)到利他的效果劫流。但是我們可以從“納什均衡”中引出“看不見(jiàn)的手”原理的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己丛忆,既不利己也不利他祠汇。
從上面的例子可以看出,當(dāng)每個(gè)人僅在考慮自身利益的時(shí)候熄诡,恰恰最終得到了對(duì)自身利益最壞的結(jié)局可很。其實(shí)破解這樣的困境,只需要我們的出發(fā)點(diǎn)變一變即可凰浮,也就是我抠,做決定的時(shí)候,從對(duì)方利益最大化的入口思考袜茧。當(dāng)每個(gè)人都這樣思考的時(shí)候菜拓,最終的結(jié)果恰恰對(duì)自己也是最好的。
我不入地獄笛厦,誰(shuí)入地獄纳鼎。正是這樣的大愿力,方能普度眾生。
在狹隘的個(gè)人利益觀蝦贱鄙,對(duì)自我利益的理性追求導(dǎo)致了每一方都最終采取了對(duì)整體利益不利的行為劝贸,因?yàn)樽非笏嚼拿恳环蕉紝⑺豢紤]的成本強(qiáng)加給對(duì)方。
然而逗宁,對(duì)于凡人來(lái)講映九,能做到這一點(diǎn),確實(shí)不易瞎颗,但開(kāi)拓的路本就不是容易屈服的人能開(kāi)拓的件甥,否則也不會(huì)稱之為困境。