兜圈子专题

Deepmind“好奇心”强化学习新突破！改变奖励机制，让智能体不再“兜圈子”...

新智元报道来源：Google AI 作者：Nikolay Savinov, Timothy Lillicrap, 编译：大明【导读】Google、Deepmind和苏黎世联邦理工学院的研究人员提出“好奇心学习”新方法，改变了智能体“好奇心”的生成方式和奖励机制，奖励机制不再基于智能体的“意外”，而是其记忆和所在情景。研究人员称，新方法可以有效降低智能体“原地兜圈子