用马尔可夫链(Markov Chain)解决装备掉落问题

先简单举个例子

假设小明每个小时只做三件事情,吃饭,睡觉,打游戏,并且他做完某件事之后会做什么事情的概率是固定的,那么我们就可以用马尔可夫链,预测他之后在每个时间段做某件事情的概率。

这样一来我们就得到了一个小明的做事规律的状态转移矩阵 [公式]

如果小明现在在睡觉,也就是 [公式]

那他下一个小时会做的事情的概率为 [公式][公式] = [公式]

再下一个小时就是 [公式][公式] =。。。(我就不算了)

他在第n个小时之后做这三件事情的概率,只需要用他的初始状态 [公式] ,去乘n次他的做事规律的状态转移矩阵就行。

通过这个例子,我们可以知道,马尔可夫链可以用来解决一些涉及概率和期望的数值问题,这里我们来尝试求解一下最经典的装备掉落问题:

每天可以刷四次副本,初始有20%掉落概率装备,如果没有掉落,则下一次掉落概率增加20%(掉落了则掉落概率回到20%),求平均每天可以掉落几件装备?

状态一指掉落概率为20%的这一状态

它有0.8的概率向状态二转移,也有0.2的概率回到自己原来的状态,即掉落装备

状态转移矩阵 [公式]

初始状态 [公式]

那么我们要求解的,刷四次副本后平均可以掉落几件装备,可以理解为刷每次副本掉落装备的概率之和。

我们用初始状态,去对状态转移矩阵做四次矩阵乘积,得到以下结果:

不论是从状态几,只要是回到状态一,即完成了一次装备掉落。

因此,0.2+0.36+0.424+0.4112=1.3952即为平均每天可以掉落的装备件数。

Leave a comment

邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据