题意
一个游戏里有k种装备,一开始等级为1,每打败一个怪兽,会随机掉落一件一种类型的装备,它的等级为[1,t+1]中的随机一个数,t为当前佩戴的类型的装备的等级,若掉落t+1等级的装备,就会佩戴该装备,否则不换,然后卖掉不要的装备,卖掉等级为i的装备(任意类型)得到金币i。问打n次怪兽之后的期望金币数。 n <= 100000,k <= 100
分析
根据期望的线性性,k是没什么用的,我们可以划分为k个子问题,最后再乘上k就可以了。
设F[i][j]表示打了i只怪兽,当前装备等级为j时的概率,分类讨论。
捡到的装备是当前类型的,乘上1/k
1、打完i-1只怪兽时装备等级是j,即F[i-1][j]*j/(j+1)
2、打完i-1只怪兽时装备等级是j-1,即F[i-1][j-1]/j
捡到的不是当前类型的,即打完第i-1只怪兽时等级是j,即F[i-1][j]*k/(k+1)
综上:F[i][j] = (1/k)*(F[i-1][j]*j/(j+1)+F[i-1][j-1]/j)+(k/k+1)*F[i-1][j];
但是上面这个只是算概率的,要如何计算期望呢?
我们很容易发现,你只有打怪物才会掉装备,才能卖钱,因此可以在转移的时候叠加就好了
转移到i的状态都来自上一层,我们就以上一层的状态打怪兽来计算即可,当然也是计算当前类型的,即累加(1/k)*F[i-1][j]*(j/2+j/(j+1))
j/2怎么推出来的呢,你有1/(j+1)的概率掉1~j等级的装备,那么根据等差数列公式:(j+1)*j/2/(j+1) = j/2,而j/(j+1)的话就是得到了j+1等级的新装备,去卖掉旧的装备。
由于精度问题,强制做100次就够了。
程序
#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <string>
#include <algorithm>
#include <iostream> using namespace std; const int maxn = ;
int n, k;
double f[][maxn]; int main()
{
freopen("a.in", "r", stdin);
freopen("a.out", "w", stdout);
scanf("%d %d", &n, &k);
for (int i = ; i <= n+; ++i)
f[][i] = ;
f[][] = 1.0;
double t = 1.0/k, ans = ;
int z = ;
for (int i = ; i <= n; ++i, z ^= )
for (int j = min(, i+); j >= ; --j)
{
f[z][j] = t*(f[z^][j]/(j+)*j+f[z^][j-]/j)
+ t*(k-)*f[z^][j];
ans += t*f[z^][j]*(0.5*j+double(j)/(j+));
}
ans *= double(k);
printf("%.10lf\n", ans);
return ;
}