决策制定专题

Sequential Decision Making under uncertain - 不确定性条件下的序列决策制定

Sequential Decision Making 序列决策制定可以被归纳为为下面的交互式闭环过程: 目标:选择能够最大化未来全部收益期望的动作(actions)。 这可能不一直都是好的标准,但这是大多数强化学习所关注的。但现在也有一些人对distribution honorable强化学习和其他方面有兴趣 可能需要平衡即时收益和长期回报可能需要策略化的行为以取得高回报(你可能需要牺牲初