在一個小鎮(zhèn)上赐纱,警察隨機(jī)在A處或者B進(jìn)行巡邏糊肤,小偷在并不知道警察的選擇的情況下要去A處或B處偷竊,這便是警察和小偷之間的博弈汁雷。
在此博弈中净嘀,博弈者雙方的選擇都是隨機(jī)的报咳,并且不一定存在最優(yōu)策略。
在我們此前介紹的最典型的囚徒博弈中挖藏,雖然同樣是不知道對方的決定暑刃,但對其中一方來說是可以制定最優(yōu)策略——坦白,盡管在雙方的最優(yōu)策略下形成的是一個差的納什平衡膜眠。但在警察和小偷的博弈中岩臣,假設(shè)雙方去A、B處的幾率一樣宵膨,那么當(dāng)一方去A處架谎,另一方去去A處則小偷被抓,去B處則小偷不會被抓辟躏,反之亦然谷扣。也就是不論對方的選擇為何,博弈者都有可能獲得好的結(jié)果和壞的結(jié)果捎琐。
因為博弈者之間的利益是沖突的会涎,所以不存在雙贏和雙輸?shù)木置妗榱耸棺陨慝@得高利益的可能性不被降低瑞凑,博弈者應(yīng)該:
不要讓對方知道自己的決定末秃。如果小偷知道警察在哪處巡邏便會避開這個地方讓警察撲空,而警察如果事先知道小偷的目標(biāo)就可以提前布局籽御、甕中捉鱉练慕。所以一旦決定被對方知曉,博弈者就會處于不利地位技掏。
在此重復(fù)性的博弈中铃将,制定混合策略,隨機(jī)選擇哑梳,讓對方捉摸不透麸塞。重復(fù)性博弈的情境是大致一樣的,如果博弈者的決策有規(guī)律可循涧衙,對可根據(jù)以往的信息推斷其本次最有可能的策略哪工,從而對此制定相應(yīng)的最優(yōu)策略以達(dá)到他的最大化利益。當(dāng)然弧哎,這也有可能只是一個陷阱雁比。只有讓對方無法知曉或者錯判我們的策略,使其做出錯誤的決定撤嫩,才能使我們更可能獲得利益偎捎。