Codeforces Round 767 (Div. 1) D2. Game on Sum (Hard Version)(博弈 期望 dp 贡献)

2024-01-19 07:04

本文主要是介绍Codeforces Round 767 (Div. 1) D2. Game on Sum (Hard Version)(博弈 期望 dp 贡献),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

题目

t(t<=1e5)组样例,每次给定n,m,k(m<=n<=1e6,0<=k<1e9+7)

有一个游戏,持续n轮,每轮Alice先选一个[0,k]的实数,

Bob决定从总分里加上这个值还是减去这个值

特别地,n轮里,Bob选择加上的次数不得少于m次

每次都是Alice先选值,选完之后Bob决策,

Alice下一轮选值的时候,是知道上一轮Bob决策结果的

Alice想让这个总分最大,Bob想让这个总分最小,

求二人都最优策略时总分的期望,答案对1e9+7取模

思路来源

官方题解

题解

先把k提出来,转化成[0,1]的实数,最后乘上k

dp[i][j]表示还剩i局bob必须加j局时alice的最大分数期望

根据转移式,alice先选择一个k,

然后bob会选择更小的那个转移,

有dp[i][j]=min(dp[i-1][j]-k,dp[i-1][j-1]+k)

所以alice会这样选择k,使得两部分相等,有dp[i-1][j]-k=dp[i-1][j-1]+k,

有dp[i][j]=(dp[i-1][j]-k+dp[i-1][j-1]+k)/2=(dp[i-1][j]+dp[i-1][j-1])/2

终态dp[i][i]=i,即必须加i轮时,每轮都加1即可

图形是一个杨辉三角图形,考虑每个(i,i)的贡献,即(i,i)到(n,m)的路径条数

第一步(i,i)只能向下,因为(i,i)和(i-1,i-1)之间不再满足dp关系式,是O(1)求的dp[i][i]=i

①(n,m)是一个对角线点,即(n,m)=(i,i),ans=i

②(n,m)不是对角线点,枚举i<n,从(i,i)到(n,m)的路径,由于第一步只能往下

即(i+1,i)到(n,m)的路径,每一步要么令x加1,要么令x和y都加1,

即n-1-i步中选m-i步令y加1,每一次x加1都乘了1/2的系数,

所以,dp[i][i]的贡献是C_{n-1-i}^{m-i}*(\frac{1}{2})^{n-i}

代码1(easy)

// Problem: D2. Game on Sum (Hard Version)
// Contest: Codeforces - Codeforces Round 767 (Div. 1)
// URL: https://codeforces.com/contest/1628/problem/D2
// Memory Limit: 256 MB
// Time Limit: 3000 ms
// 
// Powered by CP Editor (https://cpeditor.org)#include<bits/stdc++.h>
using namespace std;
#define rep(i,a,b) for(int i=(a);i<=(b);++i)
#define per(i,a,b) for(int i=(a);i>=(b);--i)
typedef long long ll;
typedef double db;
typedef pair<ll,int> P;
#define fi first
#define se second
#define pb push_back
#define dbg(x) cerr<<(#x)<<":"<<x<<" ";
#define dbg2(x) cerr<<(#x)<<":"<<x<<endl;
#define SZ(a) (int)(a.size())
#define sci(a) scanf("%d",&(a))
#define scll(a) scanf("%lld",&(a))
#define pt(a) printf("%d",a);
#define pte(a) printf("%d\n",a)
#define ptlle(a) printf("%lld\n",a)
#define debug(...) fprintf(stderr, __VA_ARGS__)
const int N=2e3+10,mod=1e9+7;
int t,n,m,k,inv2[N],dp[N][N];
int Finv[N],fac[N],inv[N];
int modpow(int x,int n,int mod){int res=1;for(;n;x=1ll*x*x%mod,n>>=1)if(n&1)res=1ll*res*x%mod;return res;
}
void init(int n){ //n<Ninv[1]=1;inv2[0]=1;inv2[1]=(mod+1)/2;for(int i=2;i<=n;++i){inv[i]=1ll*(mod-mod/i)*inv[mod%i]%mod;inv2[i]=1ll*inv2[i-1]*inv2[1]%mod;}fac[0]=Finv[0]=1;for(int i=1;i<=n;++i)fac[i]=1ll*fac[i-1]*i%mod,Finv[i]=1ll*Finv[i-1]*inv[i]%mod;//Finv[n]=modpow(fac[n],mod-2,mod);//for(int i=n-1;i>=1;--i)Finv[i]=1ll*Finv[i+1]*(i+1)%mod;
}
int C(int n,int m){if(m<0||m>n)return 0;return 1ll*fac[n]*Finv[n-m]%mod*Finv[m]%mod;
}
void sol(){sci(n),sci(m),sci(k);rep(i,1,n){dp[i][i]=i;rep(j,1,i-1){dp[i][j]=1ll*(dp[i-1][j]+dp[i-1][j-1])*inv2[1]%mod;}}printf("%d\n",1ll*dp[n][m]*k%mod);
}
int main(){init(N-1);sci(t); // t=1while(t--){sol();}return 0;
}

代码2(hard)

// Problem: D2. Game on Sum (Hard Version)
// Contest: Codeforces - Codeforces Round 767 (Div. 1)
// URL: https://codeforces.com/contest/1628/problem/D2
// Memory Limit: 256 MB
// Time Limit: 3000 ms
// 
// Powered by CP Editor (https://cpeditor.org)#include<bits/stdc++.h>
using namespace std;
#define rep(i,a,b) for(int i=(a);i<=(b);++i)
#define per(i,a,b) for(int i=(a);i>=(b);--i)
typedef long long ll;
typedef double db;
typedef pair<ll,int> P;
#define fi first
#define se second
#define pb push_back
#define dbg(x) cerr<<(#x)<<":"<<x<<" ";
#define dbg2(x) cerr<<(#x)<<":"<<x<<endl;
#define SZ(a) (int)(a.size())
#define sci(a) scanf("%d",&(a))
#define scll(a) scanf("%lld",&(a))
#define pt(a) printf("%d",a);
#define pte(a) printf("%d\n",a)
#define ptlle(a) printf("%lld\n",a)
#define debug(...) fprintf(stderr, __VA_ARGS__)
const int N=1e6+10,mod=1e9+7;
int t,n,m,k,inv2[N];
int Finv[N],fac[N],inv[N];
int modpow(int x,int n,int mod){int res=1;for(;n;x=1ll*x*x%mod,n>>=1)if(n&1)res=1ll*res*x%mod;return res;
}
void init(int n){ //n<Ninv[1]=1;inv2[0]=1;inv2[1]=(mod+1)/2;for(int i=2;i<=n;++i){inv[i]=1ll*(mod-mod/i)*inv[mod%i]%mod;inv2[i]=1ll*inv2[i-1]*inv2[1]%mod;}fac[0]=Finv[0]=1;for(int i=1;i<=n;++i)fac[i]=1ll*fac[i-1]*i%mod,Finv[i]=1ll*Finv[i-1]*inv[i]%mod;//Finv[n]=modpow(fac[n],mod-2,mod);//for(int i=n-1;i>=1;--i)Finv[i]=1ll*Finv[i+1]*(i+1)%mod;
}
int C(int n,int m){if(m<0||m>n)return 0;return 1ll*fac[n]*Finv[n-m]%mod*Finv[m]%mod;
}
void sol(){sci(n),sci(m),sci(k);int ans=0;//dp[i][j]表示还剩i局还能加j次的最大期望if(n==m){ans=n;}else{rep(i,0,n-1){//枚举(i,i)到(n,m)的路径 dp[i][i]=i*kans=(ans+1ll*C(n-i-1,m-i)*i%mod*inv2[n-i])%mod;}}ans=1ll*ans*k%mod;printf("%d\n",ans);
}
int main(){init(N-1);sci(t); // t=1while(t--){sol();}return 0;
}

这篇关于Codeforces Round 767 (Div. 1) D2. Game on Sum (Hard Version)(博弈 期望 dp 贡献)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/621604

相关文章

提示:Decompiled.class file,bytecode version如何解决

《提示:Decompiled.classfile,bytecodeversion如何解决》在处理Decompiled.classfile和bytecodeversion问题时,通过修改Maven配... 目录问题原因总结问题1、提示:Decompiled .class file,China编程 bytecode

hdu4826(三维DP)

这是一个百度之星的资格赛第四题 题目链接:http://acm.hdu.edu.cn/contests/contest_showproblem.php?pid=1004&cid=500 题意:从左上角的点到右上角的点,每个点只能走一遍,走的方向有三个:向上,向下,向右,求最大值。 咋一看像搜索题,先暴搜,TLE,然后剪枝,还是TLE.然后我就改方法,用DP来做,这题和普通dp相比,多个个向上

hdu1011(背包树形DP)

没有完全理解这题, m个人,攻打一个map,map的入口是1,在攻打某个结点之前要先攻打其他一个结点 dp[i][j]表示m个人攻打以第i个结点为根节点的子树得到的最优解 状态转移dp[i][ j ] = max(dp[i][j], dp[i][k]+dp[t][j-k]),其中t是i结点的子节点 代码如下: #include<iostream>#include<algorithm

poj2505(典型博弈)

题意:n = 1,输入一个k,每一次n可以乘以[2,9]中的任何一个数字,两个玩家轮流操作,谁先使得n >= k就胜出 这道题目感觉还不错,自己做了好久都没做出来,然后看了解题才理解的。 解题思路:能进入必败态的状态时必胜态,只能到达胜态的状态为必败态,当n >= K是必败态,[ceil(k/9.0),k-1]是必胜态, [ceil(ceil(k/9.0)/2.0),ceil(k/9.

hdu3389(阶梯博弈变形)

题意:有n个盒子,编号1----n,每个盒子内有一些小球(可以为空),选择一个盒子A,将A中的若干个球移到B中,满足条件B  < A;(A+B)%2=1;(A+B)%3=0 这是阶梯博弈的变形。 先介绍下阶梯博弈: 在一个阶梯有若干层,每层上放着一些小球,两名选手轮流选择一层上的若干(不能为0)小球从上往下移动,最后一次移动的胜出(最终状态小球都在地面上) 如上图所示,小球数目依次为

hdu4865(概率DP)

题意:已知前一天和今天的天气概率,某天的天气概率和叶子的潮湿程度的概率,n天叶子的湿度,求n天最有可能的天气情况。 思路:概率DP,dp[i][j]表示第i天天气为j的概率,状态转移如下:dp[i][j] = max(dp[i][j, dp[i-1][k]*table2[k][j]*table1[j][col] )  代码如下: #include <stdio.h>#include

usaco 1.1 Broken Necklace(DP)

直接上代码 接触的第一道dp ps.大概的思路就是 先从左往右用一个数组在每个点记下蓝或黑的个数 再从右到左算一遍 最后取出最大的即可 核心语句在于: 如果 str[i] = 'r'  ,   rl[i]=rl[i-1]+1, bl[i]=0 如果 str[i] = 'b' ,  bl[i]=bl[i-1]+1, rl[i]=0 如果 str[i] = 'w',  bl[i]=b

uva 10154 DP 叠乌龟

题意: 给你几只乌龟,每只乌龟有自身的重量和力量。 每只乌龟的力量可以承受自身体重和在其上的几只乌龟的体重和内。 问最多能叠放几只乌龟。 解析: 先将乌龟按力量从小到大排列。 然后dp的时候从前往后叠,状态转移方程: dp[i][j] = dp[i - 1][j];if (dp[i - 1][j - 1] != inf && dp[i - 1][j - 1] <= t[i]

uva 10118 dP

题意: 给4列篮子,每次从某一列开始无放回拿蜡烛放入篮子里,并且篮子最多只能放5支蜡烛,数字代表蜡烛的颜色。 当拿出当前颜色的蜡烛在篮子里存在时,猪脚可以把蜡烛带回家。 问最多拿多少只蜡烛。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cs

uva 10069 DP + 大数加法

代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#include <stack>#include <vector>#include <queue>#include <map>#include <cl