兵者飒赃,詭道也利花。
以前在跟別人石頭剪刀布的時候,會問對方你打算出什么载佳,對方一旦說出了打算炒事,就開始進(jìn)入心理博弈階段。對方說出打算出剪刀刚盈,那我就會開始思考羡洛,對方說的是實話嗎?
如果是實話藕漱,那我只要出石頭就好了欲侮,但是哪有人會把打算告訴敵人的,所以對方應(yīng)該是騙我的肋联,他打算出的是布威蕉,但再想深一層,如果他也想到我會考慮到他的欺騙行為橄仍,那他就會覺得我不會出石頭了韧涨,而是剪刀,那么他就會出石頭侮繁,所以我只要出布就一定會贏虑粥。但如果遇到對方以不變應(yīng)萬變的情況,就栽了宪哩。所以這種情況娩贷,還得把對方的智力因素放入考慮因素。
上述例子里锁孟,倘若對方以逸待勞彬祖,且一直使用這個策略茁瘦,則該策略叫做支配性策略,但這里不存在納什均衡储笑,也就是兩人使用固定的策略甜熔。
萬老師指出,這是“沒有純策略的納什均衡”突倍,但是如果要參加多次罰點球腔稀,運(yùn)用“混合策略”這個系統(tǒng)可以取勝。
以一定的概率往左踢羽历,以一定的概率往右踢烧颖。這是顯而易見的,但如果計算概率才是關(guān)鍵窄陡。
假設(shè)我比較喜歡往左邊踢,如果我以各50%的概率拆火,那守門員會堅決撲向右邊跳夭,因為我的習(xí)慣的存在,守門員會覺得右邊更值得交給運(yùn)氣们镜。50%的概率雖然無法預(yù)測币叹,但我的習(xí)慣很容易被對手利用。
那么這個時候要做的就是混合策略模狭,結(jié)合自己往左踢和往右踢的進(jìn)球概率颈抚,合理搭配往左踢和往右踢的概率,誤導(dǎo)對方以為不過撲左邊還是撲右邊嚼鹉,我進(jìn)球的概率都是一樣的贩汉。
馮·諾依曼提出的理論——最小最大值定理。就是把對手的最大報償最小化锚赤,有兩點匹舞,一是按照一定的概率,混合自己的打法线脚,二是這套打法必須讓對手無法利用赐稽,也就是所謂的陽謀。你知道我在干嘛浑侥,但是你拿我沒辦法姊舵。
如果你一直說謊話,其實和說實話一樣寓落。最佳撒謊者是把實話和謊話結(jié)合括丁,且別人無法計算出占比。
人類最無法執(zhí)行隨機(jī)性策略零如,比如要執(zhí)行以40%和60%的概率來罰點球躏将,是先踢4個左锄弱,再踢6個右嗎?這樣安排太整齊了祸憋,別人很容易就能發(fā)現(xiàn)并加以利用会宪。那交替進(jìn)行呢?踢了兩次左之后蚯窥,第三次就很想踢右掸鹅,守門員很可能就會防守右邊。這其中其實還涉及到一些賭徒謬論拦赠,這個放在文末寫巍沙。
正確的做法就是執(zhí)行真實的隨機(jī)性,如一本書荷鼠,翻到頁碼個數(shù)是0-3就踢左句携,4-9就踢右。只要不是真的隨機(jī)性允乐,就會被發(fā)覺矮嫉。
足球比賽中,梅西明明很厲害牍疏,但在場上看到的表現(xiàn)通常不是他一直持球蠢笋,突破。因為實力強(qiáng)鳞陨,所以被重點防守昨寞,很大程度上起到的是一個牽制對方防守隊員的作用,球星再強(qiáng)厦滤,也要一定概率的傳給隊友援岩,這樣才能讓陣容更加詭異。
這種策略屬于陽謀馁害,就算對方知道你在計算概率窄俏,也不知道你的概率是多少。以前看柯南的時候碘菜,許多犯罪手法是根據(jù)被害人的生活習(xí)慣來制定方案的凹蜈,這使我一度頻繁改變我的放學(xué)回家路線。曹操也說過類似的言論忍啸,真正的英雄不應(yīng)該有被敵人利用的規(guī)律仰坦。
文中所說的賭徒謬論,守門員猜?lián)渥筮€是撲右计雌,其實跟猜測硬幣的正反面一樣悄晃,我們都知道正反面概率是50%,所以有些人會理所當(dāng)然的以為已經(jīng)拋了1000次正面了,那第1001次一定是反面妈橄,然而第1001次正反面的概率還是各占50%庶近。撲球同理,如果射門的選手左右交替太頻繁眷蚓,刻意去營造相對平衡的概率鼻种,那前兩次射了左邊,第三次很大的概率就是右邊沙热。
博弈論真是魅力四射叉钥!