中对战专题

强化学习-你在游戏中对战的人机是如何对付你的!

目录 1.与环境交互的数据介绍 2.要完成的目标分析 3.baseline方法 4.Onpolicy与Offpolicy策略。 在前面我写了一篇文章叫《强化学习-什么是强化学习?白话文告诉你!》这篇文章用了很通俗易懂的例子介绍了强化学习的一些基本的知识点。 读完上面的文章,再来看本篇文章算是比较合适,因为,研究嘛,终究是离不开数学的,所以本篇文章包含大量的公式,虽然学习公式的过程很