問(wèn)題背景:游戲強(qiáng)化裝備期望是怎么計(jì)算的?@知乎
解答參考該問(wèn)題下@劉昆和@朱元晨兩位dalao的回答
馬氏鏈期望計(jì)算例子:[markov系列2]馬爾可夫鏈中的期望問(wèn)題
裝備有個(gè)等級(jí)隅俘,瞬欧,對(duì)等級(jí)的裝備強(qiáng)化有等級(jí)變?yōu)?img class="math-inline" src="https://math.jianshu.com/math?formula=k%2B1" alt="k+1" mathimg="1">和兩個(gè)結(jié)果(停留在等級(jí)也可以視作三個(gè)結(jié)果)烘贴。裝備等級(jí)變化之間是條件獨(dú)立的羡儿,本次強(qiáng)化結(jié)果只和前一次強(qiáng)化結(jié)果相關(guān)事示。
- 馬爾科夫過(guò)程的期望次數(shù)
定義隨機(jī)過(guò)程表示早像,記,即為
其中肖爵,表示的概率卢鹦。
由此得到一步狀態(tài)轉(zhuǎn)移矩陣為
表示從,顯然有
這里+1實(shí)際上是補(bǔ)了一個(gè)不存在的狀態(tài)輔助計(jì)算劝堪,用來(lái)描述冀自,狀態(tài)到都是互達(dá)的,狀態(tài)到狀態(tài)的概率為1秒啦,狀態(tài)到任意狀態(tài)的概率為0.
可以得到線性方程組
進(jìn)一步有
故
其中為狀態(tài)轉(zhuǎn)移矩陣熬粗,為單位矩陣。