#今日论文推荐#ICLR 2022｜让绝艺上桌打麻将，腾讯AI Lab全新策略优化算法战胜人类冠军

本文主要是介绍#今日论文推荐#ICLR 2022｜让绝艺上桌打麻将，腾讯AI Lab全新策略优化算法战胜人类冠军，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

#今日论文推荐#ICLR 2022｜让绝艺上桌打麻将，腾讯AI Lab全新策略优化算法战胜人类冠军

「绝艺」又有了新成果：在1v1麻将（二人雀神）测试中战胜职业冠军选手。
对于 AI 领域的研究者和从业者来说，腾讯 AI Lab 研发的围棋 AI「绝艺」的名字并不陌生。自 2016 年面世后，它已四次夺得世界顶级赛事冠军，包括 UEC 杯、AI 龙星战、腾讯世界人工智能围棋大赛、世界智能围棋公开赛等，并自 2018 年起无偿担任中国国家围棋队训练专用 AI。
在围棋以外，腾讯 AI Lab 绝艺团队持续深入研究大规模二人零和博弈问题，从完美信息游戏（围棋）逐步拓展至非完美信息游戏（例如麻将）。
4 月 25 日，腾讯 AI Lab 宣布棋牌类 AI「绝艺」取得新突破，在 1v1 麻将（二人雀神）测试中战胜职业冠军选手。团队在大规模强化学习算法框架下提出了一个新的策略优化算法 Actor-Critic Hedge (ACH)，部分解决了大规模深度强化学习自博弈收敛不到纳什均衡最优解的问题。该算法及对应二人麻将 benchmark 已通过论文开源，并被机器学习顶会 ICLR 2022 收录。

论文题目：ACTOR-CRITIC POLICY OPTIMIZATION IN A LARGE SCALE IMPE
详细解读：https://www.aminer.cn/research_report/626a01347cb68b460faad1aa?download=falsehttps://www.aminer.cn/research_report/626a01347cb68b460faad1aa?download=false
AMiner链接：https://www.aminer.cn/?f=cs