兜圈子专题

Deepmind“好奇心”强化学习新突破!改变奖励机制,让智能体不再“兜圈子”...

新智元报道   来源:Google AI  作者:Nikolay Savinov,  Timothy Lillicrap, 编译:大明 【导读】Google、Deepmind和苏黎世联邦理工学院的研究人员提出“好奇心学习”新方法,改变了智能体“好奇心”的生成方式和奖励机制,奖励机制不再基于智能体的“意外”,而是其记忆和所在情景。研究人员称,新方法可以有效降低智能体“原地兜圈子