现在的位置: 首页 > 综合 > 正文

hdu3853 LOOPS 2011 Invitational Contest Host by BUPT

2018年04月25日 ⁄ 综合 ⁄ 共 1167字 ⁄ 字号 评论关闭

昨天看了看概率DP的题,主要都是在推公式。状态转移方程是把该状态分成disjoint sample space,再向后转移。

dp[i][j]常用于该状态到最终状态的期望值,所以状态向后转移。

这里面,dp[i,j]=2+p[i,j,0]*dp[i,j]+p[i,j,1]*dp[i,j+1]+p[i,j,2]*dp[i+1,j]

+2是因为只要要进行选择,无论结果如何,一定会消耗2 energy,然后下一步可能在[i,j],[i+1,j],[i,j+1]

这一题也可以记忆化搜索,直接从后向前递推也OK。

之前WA了一次是因为少了特判p[i][j][0]=0,因为出现在分母上,我print了一下发现如果分母=0那个dp[i][j]就不会输出==

#include<iostream>
#include<stdio.h>
#include<cstdio>
#include<stdlib.h>
#include<vector>
#include<string>
#include<cstring>
#include<cmath>
#include<algorithm>
#include<stack>
#include<queue>
#include <ctype.h>
using namespace std;
//hdu 3853
int R;
int C;
const int maxn=1010;
double p[maxn][maxn][3];
double dp[maxn][maxn];
void run()
{
    memset(dp,0,sizeof(dp));
    dp[R][C]=0;
    for(int i=R;i>=1;i--)
    {
        for(int j=C;j>=1;j--)
        {
            if(i==R&&j==C) continue;
            if(p[i][j][0]==1) continue;//因为下面有除法,所以要特判分母=0的case
            dp[i][j]=(2+p[i][j][1]*dp[i][j+1]+p[i][j][2]*dp[i+1][j])/(1-p[i][j][0]);
            //cout<<i<<" "<<j<<" "<<dp[i][j]<<endl;
        }
    }
    printf("%.3lf\n",dp[1][1]);
}
int main()
{
    freopen("input.txt","r",stdin);
    // freopen("data.txt","r",stdin);
     //freopen("out1.txt","w",stdout);
    while(scanf("%d %d",&R,&C)!=EOF)
    {
        for(int i=1;i<=R;i++)
        {
            for(int j=1;j<=C;j++)
            {
                scanf("%lf %lf %lf",&p[i][j][0],&p[i][j][1],&p[i][j][2]);
            }
        }
        run();
    }
    return 0;
}




抱歉!评论已关闭.