n-armed bandit_Gittins index

2024-04-10 23:32

文章标签 index bandit armed gittins

本文主要是介绍n-armed bandit_Gittins index，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

The complexity of solving MAB (multi-armed bandit) using Markov decision theory increases exponentially with the number of bandit processes.
Instead of solving the n-dimensional MDP with the state-space $\prod_{i=1}^n \chi^i$ , the optimal solution(Gittins Index) is obtained by solving n 1-dimensional optimization problems.
The index is given as,

ν i (x i) = s u p τ > 0 E [ \sum τ t = 0 β t r i ( X i t ) | X i 0 = x i ] E [ \sum τ t = 0 β t | X i 0 = x i ]

$\nu^i(x^i)=sup_{\tau>0}\frac {E[\sum_{t=0}^\tau \beta^tr^i(X_t^i)|X_0^i=x^i]}{E[\sum_{t=0}^\tau \beta^t|X_0^i=x^i]}$

Off-Line Algorithm for computing Gittins Index

1. Largest-Remaining-Index Algorithm

Initialization: identify the state $\alpha_1$ with the highest Gittins index.
$S(\alpha_1)=\chi$ , $\nu(\alpha_1)=r(\alpha_1)=r_{\alpha_1}$
choose: $\alpha_1=argmax_{\alpha\in\chi}\quad r_{\alpha}$
corresponding Gittins index is: $\nu(\alpha_1)=r_{\alpha_1}$
Recursion step:
Define the $m\times m$ matrix by $\forall a,b\in\chi$

Q (k) a, b = {P a, b 0 if b \in C (α k) otherwise

$Q_{a,b}^{(k)}= \begin{cases} P_{a,b}& \text{if b$\in C(\alpha_k)$}\\ 0& \text{otherwise} \end{cases}$
and define the

m×1 $m\times 1$ vectors:

d

这篇关于n-armed bandit_Gittins index的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/892460。 23002807@qq.com

相关文章

python3如何找到字典的下标index、获取list中指定元素的位置索引

python3如何找到字典的下标index、获取list中指定元素的位置索引

《python3如何找到字典的下标index、获取list中指定元素的位置索引》：本文主要介绍python3如何找到字典的下标index、获取list中指定元素的位置索引问题,具有很好的参考价值,... 目录enumerate()找到字典的下标 index获取list中指定元素的位置索引总结enumerat

阅读更多...

浅析CSS 中z - index属性的作用及在什么情况下会失效

浅析CSS 中z - index属性的作用及在什么情况下会失效

《浅析CSS中z-index属性的作用及在什么情况下会失效》z-index属性用于控制元素的堆叠顺序,值越大,元素越显示在上层,它需要元素具有定位属性（如relative、absolute、fi... 目录1. z-index 属性的作用2. z-index 失效的情况2.1 元素没有定位属性2.2 元素处

阅读更多...

IEEE会议投稿资料汇总http://cadcg2015.nwpu.edu.cn/index.htm

IEEE会议投稿资料汇总http://cadcg2015.nwpu.edu.cn/index.htm

最近投了篇IEEE的顶级会议文章，一下是比较有用的一些资料，以供参考。 1.会议主页：http://cadcg2015.nwpu.edu.cn/index.htm （The 14th International Conference on Computer-Aided Design and Computer Graphics (CAD/Graphics 2015)） 2.I

阅读更多...

INDEX+SMALL+IF+ROW函数组合使用解…

INDEX+SMALL+IF+ROW函数组合使用解…

很多人在Excel中用函数公式做查询的时候，都必然会遇到的一个大问题，那就是一对多的查找/查询公式应该怎么写？大多数人都是从VLOOKUP、INDEX+MATCH中入门的，纵然你把全部的多条件查找方法都学会了而且运用娴熟，如VLOOKUP和&、SUMPRODUCT、LOOKUP(1,0/....，但仍然只能对这种一对多的查询望洋兴叹。这里讲的INDEX+SMALL+IF+ROW的函数组合，

阅读更多...

CTFHub技能树-Git泄漏-Index

CTFHub技能树-Git泄漏-Index

目录一、Git索引（Index）的基本概念二、解题过程主旨：使用git泄漏恢复源代码方法一：使用GitHack手动恢复方法二：直接使用Git_Extract获取网站源代码拿去flag 当前大量开发人员使用git进行版本控制，对站点自动部署。如果配置不当,可能会将.git文件夹直接部署到线上环境。这就引起了git泄露漏洞。请尝试使用BugScanTeam的Gi

阅读更多...

android.database.CursorIndexOutOfBoundsException: Index 5 requested, with a size of 5

android.database.CursorIndexOutOfBoundsException: Index 5 requested, with a size of 5

描述： 01-02 00:13:43.380: E/flyLog:ChatManager(963): getUnreadChatGroupandroid.database.CursorIndexOutOfBoundsException: Index 5 requested, with a size of 5 01-02 00:13:43.380: E/flyLog:ChatManager(

阅读更多...

关于OceanBase MySQL 模式中全局索引 global index 的常见问题

关于OceanBase MySQL 模式中全局索引 global index 的常见问题

在OceanBase的问答区和开源社区钉钉群聊中，时常会有关于全局索引 global index的诸多提问，因此，借这篇博客，针对其中一些普遍出现的问题进行简要的解答。什么是 global index ？由于 MySQL 不具备 global index 的概念，因此这一问题会经常被社区版用户提及。就在前几天，就要人询问下面这个语法的意义。 create table part_tes

阅读更多...

运行PHP程序时提示“Notice: Undefined index”的解决办法

运行PHP程序时提示“Notice: Undefined index”的解决办法

最近在调试网站程序的时候，不知道怎么经常出现“Notice:Undefined index”的提示，程序又可以正常运行，就是看到这个提示感觉有点不爽，把模板搞乱了，经查其实这个不是错误，是警告。如果服务器不能改，那每个变量使用前应当先定义。怎么样解决呢？很多网友的说法不一致，程序不一样你也根本没办法照着解决，要是自己慢慢研究的话一大堆代码得半天试，在这里提供一个最简单有效经本人测试有效的办法给大家

阅读更多...

【硬刚ES】ES基础（十三）Dynamic Template和Index Template

【硬刚ES】ES基础（十三）Dynamic Template和Index Template

本文是对《【硬刚大数据之学习路线篇】从零到大数据专家的学习指南(全面升级版)》的ES部分补充。

阅读更多...

mysql 的函数用法SUBSTRING_INDEX

mysql 的函数用法SUBSTRING_INDEX

因为数据库的数据要更新操作，内容是这样的：这是之前的数据，现在因为需求变更，只需要横杠之前的数据，数据量少可以手动改，但是有几百条的数据，所以找到了一个方法 UPDATE product SET pro_price=SUBSTRING_INDEX(pro_price, '-', 1); 这个SUBSTRING_INDEX就是用来截取的 pro_price是要修改的字段名，然后中间

阅读更多...