advantage专题

Learning to play snake at 1 million FPS Playing snake with advantage actor-critic

在这篇博文中，我将引导您完成我最近的项目，该项目结合了我发现的两件令人着迷的东西 - 电脑游戏和机器学习。很长一段时间以来，我一直想深入了解强化学习，我认为没有比做自己的项目更好的方法了。为此，我在PyTorch中实现了经典的手机游戏“Snake”，并训练了强化学习算法来进行游戏。这篇文章分为三个部分。 Snake游戏的大规模并行矢量化实现Advantage Actor-Critic（A2

Learning to play snake at 1 million FPS Playing snake with advantage actor-critic