聰明囚徒的困境
談這個(gè),首先要提個(gè)題外話題京髓,什么叫博弈論航缀,左右也是無意中涉及到這個(gè)話題,在網(wǎng)上搜了一圈堰怨,擺度如下:
古語有云芥玉,世事如棋。生活中每個(gè)人如同棋手诚些,其每一個(gè)行為如同在一張看不見的棋盤上布一個(gè)子飞傀,精明慎重的棋手們相互揣摩皇型、相互牽制诬烹,人人爭贏,下出諸多精彩紛呈弃鸦、變化多端的棋局绞吁。博弈論是研究棋手們 “出棋” 著數(shù)中理性化、邏輯化的部分唬格,并將其系統(tǒng)化為一門科學(xué)家破。換句話說颜说,就是研究個(gè)體如何在錯(cuò)綜復(fù)雜的相互影響中得出最合理的策略。事實(shí)上汰聋,博弈論正是衍生于古老的游戲或曰博弈如象棋门粪、撲克等。數(shù)學(xué)家們將具體的問題抽象化烹困,通過建立自完備的邏輯框架玄妈、體系研究其規(guī)律及變化。這可不是件容易的事情髓梅,以最簡單的二人對弈為例拟蜻,稍想一下便知此中大有玄妙:若假設(shè)雙方都精確地記得自己和對手的每一步棋且都是最“理性” 的棋手,甲出子的時(shí)候枯饿,為了贏棋酝锅,得仔細(xì)考慮乙的想法,而乙出子時(shí)也得考慮甲的想法奢方,所以甲還得想到乙在想他的想法搔扁,乙當(dāng)然也知道甲想到了他在想甲的想法…
簡言之博弈論是指某個(gè)個(gè)人或是組織,面對一定的環(huán)境條件蟋字,在一定的規(guī)則約束下阁谆,依靠所掌握的信息,從各自選擇的行為或是策略進(jìn)行選擇并加以實(shí)施愉老,并從各自取得相應(yīng)結(jié)果或收益的過程场绿,在經(jīng)濟(jì)學(xué)上博奕論是個(gè)非常重要的理論概念。
言歸正傳“聰明的囚徒”
甲嫉入、乙兩個(gè)人一起攜槍準(zhǔn)備作案焰盗,被警察發(fā)現(xiàn)抓了起來。因?yàn)闆]有其他犯罪證據(jù)咒林,警方只能以非法攜帶槍支的輕罪處罰他們熬拒。但是警方懷疑這兩個(gè)人可能還犯有其他重罪,于是分別進(jìn)行審訊垫竞。警方告訴他們:如果主動坦白澎粟,就有可能得到寬大處理。否則欢瞪,一旦同伙主動交代活烙,抗拒者則必將受到重罰,而坦白者可以立功減刑遣鼓。
在這種情形下啸盏,這兩個(gè)囚犯必須作出自己的選擇:或者他們相互背叛,與警方合作骑祟;或者保持沉默回懦,和自己的同伙合作气笙。這樣就會出現(xiàn)以下幾種情況(為了更清楚地說明問題,我們給每種情況設(shè)定具體刑期):
1怯晕、如果兩人都不坦白潜圃,警方會以非法攜帶槍支罪各判兩人1年徒刑;
2舟茶、如果其中一人招供秉犹,而另一人不招,坦白者作為證人將被免予起訴稚晚,另一人將會被重判10年崇堵;
3、如果兩人都招供客燕,則兩人都會因搶劫罪各判5年鸳劳。
我們假設(shè)這是兩個(gè)聰明的囚犯,現(xiàn)在這兩個(gè)聰明的囚犯該怎么辦呢也搓?是選擇相互合作還是相互背叛赏廓?從表面上看,他們應(yīng)該相互合作傍妒,保持沉默幔摸,因?yàn)檫@樣他們倆將得到對雙方來說都是最好的結(jié)果——只獲刑1年。但是颤练,由于信息被封閉既忆,兩人無法交流,而他們又不得不考慮對方可能采取的選擇嗦玖。由于甲患雇、乙兩個(gè)人都十分精明,所以他們都會優(yōu)先考慮如何才能減少自己的刑期宇挫,至于同伙被判多少年已經(jīng)顧不得許多了苛吱。
這里左右先賣個(gè)關(guān)子,只是想問器瘪,如果是我翠储,身處其中,會如何抉擇橡疼?會不信任同伴還選擇招供還是……說實(shí)話援所,對人性的判定,事情如果沒有真實(shí)發(fā)生衰齐,一切都只是個(gè)假設(shè)任斋,人性的弱點(diǎn)也只有在危難來臨時(shí)方能淋漓體現(xiàn)。好像有些跑題了耻涛,今天先抄到這里废酷。需要做出說明的是:全文基本引用我朋友發(fā)過來的書,因沒有首頁抹缕,不太清楚叫什么名字澈蟆,好像叫關(guān)于策略的63個(gè)有趣話題,只是覺得很有意義卓研,拿出來其共享趴俘。
囚徒困境的結(jié)果就是兩個(gè)人全招供,用唐邑的話說,全被警察博弈了.
因?yàn)槿硕紩兴叫牡?每個(gè)人都會這樣推理:假如對方不招,我一招就可以馬上出去,而不招會判1年,假如對方招了,我也招了,那只判5年而已,而不招會判10年.可見,無論對方招與不招,我的最佳選擇都是招認(rèn),兩個(gè)人都會基于同樣的想法做出招供的選擇,這對他們個(gè)人來說都是最佳的,即最符合他們個(gè)體理性的選擇.但就整體而言卻是一個(gè)最差的結(jié)果.
其實(shí)兩個(gè)人明明知道合作可以達(dá)到一個(gè)最優(yōu)的結(jié)果,可事實(shí)卻往往總是事與愿違呢?為什么會發(fā)生這樣的事?
因?yàn)槿祟惖奶煨允勤吚芎Φ?是自私的.用英國哲學(xué)家堆布斯的話說,"自然狀態(tài)"中人與人之間像狼與狼一樣,是"每個(gè)人對每個(gè)人的戰(zhàn)爭".在這種狀態(tài)中,每個(gè)人都力圖保護(hù)自己的利益,并企圖占有別人的東西,此時(shí)每個(gè)人是每個(gè)人的敵人.此時(shí)沒有任何規(guī)則,沒有財(cái)產(chǎn),沒有正義或不正義,只有戰(zhàn)爭.而"囚徒困境"恰恰準(zhǔn)確地抓住了人性真實(shí)的一面:相互防范背叛與不彼此的不信任.
這倒使我想起荀子的一段話:"凡人有所一同。饑而欲食奏赘,寒而欲暖寥闪,勞而欲息,好利而惡害磨淌。是人之所生而有也疲憋,是無待而然者也,是禹桀之所同也梁只。目辨白黑美惡缚柳,耳辨音聲清濁,口辨酸咸甘苦搪锣,鼻辨芬芳腥臊秋忙,骨體膚理辨寒暑疾養(yǎng)。是又人之所生而有也构舟,是無待而然者也灰追,是禹桀之所同也」烦可以為堯禹监嗜,可以為桀跖,可以為工匠抡谐,可以為農(nóng)賈裁奇,在執(zhí)注錯(cuò)習(xí)俗之所積耳。湯武存則天下從而治麦撵,桀紂存則天下從而亂刽肠,如是者豈非人之情固可與如此,可與如彼也哉免胃?材性知能音五,君子小人一也。好榮惡辱羔沙,好利惡害躺涝,是君子小人之所同也。人之生固小人扼雏,無師無法則唯利之見耳坚嗜。堯禹者夯膀,非生而具者也,夫起于變故苍蔬,成乎修為诱建,待盡而后備者也〉螅”——《荀子·榮辱》
但這里與“囚徒困境”案例中有個(gè)不同之處:這就是博弈論專家所謂的“重復(fù)的囚徒困境”俺猿,它更
逼真地反映了具有經(jīng)常而長期性的人際關(guān)系。而且格仲,這種重復(fù)的游戲允許程序在做出合作或背叛的抉擇時(shí)參考對手程序前幾次的選擇押袍。如果兩個(gè)程序只玩過一個(gè)回合,則背叛顯然就是唯一理性的選擇凯肋。但如果兩個(gè)程序已經(jīng)交手過多次谊惭,則雙方就建立了各自的歷史檔案,用以記錄與對手的交往情況否过。同時(shí)午笛,它們各自也通過多次的交手樹立了或好或差的聲譽(yù)。
其實(shí)我曾也就這個(gè)問題問過周圍的一些人苗桂,大家不約而同會想到:對方是什么人药磺?對象不同,采取的行動也會不同煤伟“┡澹可見每個(gè)人心里都有一個(gè)評判風(fēng)險(xiǎn)的系統(tǒng),良好的信譽(yù)才能營造良好的信任便锨,從而打破博弈論中“囚徒的困境“围辙。