DeepMind携手暴雪发战帖:周五直播AI打星际II,发布研究新进展

本文主要是介绍DeepMind携手暴雪发战帖:周五直播AI打星际II,发布研究新进展,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

bb

大数据文摘出品

作者:魏子敏、蒋宝尚

半年前,OpenAI Five在Ti8赛事中与人类职业选手大战DOTA的盛况还历历在目,年前,DeepMind AI也要在游戏界搞大事情了。

这次,AI要挑战的是暴雪的经典游戏——星际争霸II。

DeepMind今天在twitter上公开发布了“战帖”,表示要在两天后当地时间周四下午6点,也就是北京时间周五凌晨2点,直播打星际II。

这不是一次简单的直播,更像是一场特别的“发布会”,DeepMind想要通过这场比赛,公开展示AI“学到的新战术”。

本次的将要出战的AI是由DeepMind和暴雪联合培养的,经过了“特别的训练方式”,似乎对这次比赛的胜利很有信心。

bb

比赛将会在星际的Twitch频道和DeepMind的Youtube频道同步直播,先给出网址,星际II的玩家们,你们准备好对抗AI了吗?

Twitch

https://www.twitch.tv/starcraft

YouTube:

https://www.youtube.com/c/deepmind

暴雪:“所有AI都在以几何速度学习进步”

暴雪在最近的BlizzCon上,总结了自己2018年的工作,并相当低调地发布了“与DeepMind合作正在继续 ”的更新:

DeepMind一直在努力训练他们的AI更好地了解星际争霸II。一旦它开始掌握游戏的基本规则,它开始展示“有趣”的行为,例如立即冲向对手。目前,即时在“疯狂”难度下的星际争霸II,AI的成功率已经可以达到50%!


而且它还在学习:“在向它提供了更多真实玩家的游戏回放之后,AI开始执行标准的宏观策略,以及防御诸如加农炮冲击等激进战术。”

bb

暴雪的新年总结

经过三个月的训练,显然这只AI取得了不错的进展,而DeepMind和暴雪都认为现在已经到了将其公诸于众的时候。

暴雪今天也发布声明称,这场比赛将提醒我们,所有AI都在以几何速度学习。“星际争霸游戏已经成为人工智能社区的“巨大挑战”,因为它们是针对诸如规划,处理不确定性和空间推理等问题的进展基准的完美环境。” 

其实早在2016年,Deepmind已经立下Flag要教会AI玩儿星际争霸II,也已经有包括facebook、阿里巴巴等不少科技公司或者研究机构开拓过“星际”这片竞技场,但DeepMind这样专治人类各种不服的公司正式宣布与暴雪合作,还是让一票星际玩家大呼“热血”。 暴雪承诺将持续发布从“星际争霸II”天梯中收集的数十万个匿名录像,这会将训练变得更加容易。 

2017年7月份,DeepMind已经官宣正式与暴雪娱乐合作,共同开发可以在星际争霸II中与人类玩家对抗的AI,并且发布了SC2LE,一个旨在加速即时战略游戏当中AI应用的工具集。

这次训练的AI所采用的数据,很可能是暴雪承诺过的“星际争霸II”天梯中收集的数十万个匿名录像。有了这些数据,相信AI的能力也会有突飞猛进的提升。

bb

后台回复“星际争霸”,即可获得DeepMind相关论文



搞定星际争霸可能需要十只升级版阿尔法狗

不要以为有了优质数据就能训练出来超强的AI。其实这并不是一项轻松的任务,因为视频游戏的复杂性和更多可能性也让AI战胜人类要远比在棋盘游戏上复杂。

星际争霸和星际争霸II是史上最大和最成功的游戏之一,它们见证了许多玩家从青葱岁月到为人父母的20多年。其原始游戏早已被AI和ML研究人员使用,并在每年的AIIDE机器人大赛中进行角逐

AIIDE机器人大赛

http://www.cs.mun.ca/~dchurchill/starcraftaicomp/

使用AI在星际争霸中对战人类玩家会比围棋艰难得多,对于AI来说,最大的难点在于,每一场对决都存在大量可能的方式。

据估计,每场对决有101685种可能的配置,为了给大家一个直观感受,阿尔法狗的配置层是10170。

此外,不同于棋类游戏的轮流依次进行走步,并且拥有决策的时间,在星际争霸中,玩家会同时出招,且不能看到对方玩家的状态,也就是说,所有决定需要在“不完整信息”的情况下做出。所有这些都意味着,你不能仅靠逻辑和一些步骤找到赢得对决的最优方式,玩家更需要的是策略和直觉。

PySC2助力AI训练

星际争霸II的玩家在同一时间可能有300多种基本行动可以选择,因此策略集及策略选择也对AI构成了巨大的挑战。与此形成鲜明对比的是雅达利游戏,大概只有10种选择(例如,下,左,右等)。除此之外,星际争霸中的很多操作是分级的,可以进行修改和扩充,其中很多都需要操作屏幕上的一个点进行。即使一个小84X84的屏幕也会产生大约1亿种可能的行动选择。

之前发布的PySC2可以帮助研究人员利用暴雪自己的工具来解决这些挑战,并且构建自己的任务和模型。

PySC2环境提供了一个灵活的,易于使用的RL代理游戏界面。在最初的版本中,游戏被分解为‘特征层’,其中的游戏元素,如单元类型、单位的健康度和地图的可见性彼此隔离,同时保留游戏的核心视觉和空间元素。

之前发布的PySC2还包括一系列的迷你游戏,一种将游戏分解成小模块的技术,可以用来测试特定任务的代理,比如移动视角、收集矿物碎片或选择单位。DeepMind希望研究人员可以测试他们的技术,并且开发新的迷你游戏,以供其他研究人员进行使用和评估。

bb

简单的RL迷你游戏可以让研究者测试代理在一些特定任务上的表现

bb

训练过和未训练过的代理在玩迷你游戏

从棋牌游戏到实时对战,AI不断挑战自己

1997年,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI。

在2016年年底,一个名为“Master”的神秘在线围棋玩家出现在了热门的亚洲游戏服务器Tygem上。在接下来的几天里,这个神秘的玩家横扫世界范围内的许多一流玩家。

bb

2017年5月,AlphaGo“Master”在对战世界排名最高的围棋选手柯洁中屡屡得分。在三场比赛中,人工智能稳操胜券。

2017年12月,DeepMind发布了一个更新版本的系统。这款名为“AlphaZero”的新人工智能可以在短短几个小时内掌握各种游戏。经过仅仅8个小时的自我训练,这个系统不仅能打败AlphaGo Zero的早期版本,而且还可以成为象棋大师和将棋(shogi,又称日本象棋,一种流行于日本的棋盘游戏)的冠军。

在拿到棋牌类的王者之后,人工智能向更复杂的实时对战游戏领域进发。

2018年,OpenAI Five与DOTA2半职业玩家团队交手,比赛结果是2:1,人类输掉了比赛。在2017年,比较原始版本的AI在1v1战斗中就击败了人类职业玩家Dendi。

2018年8月份,人工智能在Ti8赛事中与职业玩家交手,比赛结果是两场比赛,人类玩家守住了DOTA这一高地。其中,第二场与中国玩家交手,在第45分钟的时候,AI直接认输。

2018年9月,腾讯AI Lab发布论文称,他们构建的AI首次在完整的虫族VS虫族比赛中击败了星际2的内置机器人Bot。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31562039/viewspace-2564547/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/31562039/viewspace-2564547/

这篇关于DeepMind携手暴雪发战帖:周五直播AI打星际II,发布研究新进展的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/189404

相关文章

揭秘未来艺术:AI绘画工具全面介绍

📑前言 随着科技的飞速发展,人工智能(AI)已经逐渐渗透到我们生活的方方面面。在艺术创作领域,AI技术同样展现出了其独特的魅力。今天,我们就来一起探索这个神秘而引人入胜的领域,深入了解AI绘画工具的奥秘及其为艺术创作带来的革命性变革。 一、AI绘画工具的崛起 1.1 颠覆传统绘画模式 在过去,绘画是艺术家们通过手中的画笔,蘸取颜料,在画布上自由挥洒的创造性过程。然而,随着AI绘画工

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

AI儿童绘本创作

之前分享过AI儿童绘画的项目,但是主要问题是角色一致要花费很长的时间! 今天发现了这款,非常奈斯! 只需输入故事主题、风格、模板,软件就会自动创作故事内容,自动生成插画配图,自动根据模板生成成品,测试效果如下图。 变现方式:生成儿童绘本发布到各平台,吸引宝妈群体进私域。  百度网盘 请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全

人工和AI大语言模型成本对比 ai语音模型

这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。 但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。让“今天天气很好”的概率高于“今天天汽很好”的概率,得到声学模型概率高,又符合表达

智能客服到个人助理,国内AI大模型如何改变我们的生活?

引言 随着人工智能(AI)技术的高速发展,AI大模型越来越多地出现在我们的日常生活和工作中。国内的AI大模型在过去几年里取得了显著的进展,不少独创的技术点和实际应用令人瞩目。 那么,国内的AI大模型有哪些独创的技术点?它们在实际应用中又有哪些出色表现呢?此外,普通人又该如何利用这些大模型提升工作和生活的质量和效率呢?本文将为你一一解析。 一、国内AI大模型的独创技术点 多模态学习 多

【新闻】AI程序员要来了吗?阿里云官宣

内容提要 6 月 21 日,在阿里云上海 AI 峰会上,阿里云宣布推出首个AI 程序员。 据介绍,这个AI程序员具备架构师、开发工程师、测试工程师等多种岗位的技能,能一站式自主完成任务分解、代码编写、测试、问题修复、代码提交整个过程,最快分钟级即可完成应用开发,大幅提升研发效率。 近段时间以来,有关AI的实践应用突破不断,全球开发者加速研发步伐。有业内人士坦言,随着大模型性能逐渐提升,AI应

WordPress网创自动采集并发布插件

网创教程:WordPress插件网创自动采集并发布 阅读更新:随机添加文章的阅读数量,购买数量,喜欢数量。 使用插件注意事项 如果遇到404错误,请先检查并调整网站的伪静态设置,这是最常见的问题。需要定制化服务,请随时联系我。 本次更新内容 我们进行了多项更新和优化,主要包括: 界面设置:用户现在可以更便捷地设置文章分类和发布金额。代码优化:改进了采集和发布代码,提高了插件的稳定

AI元宇宙

随着科技的迅猛发展,人工智能(AI)迎来了一个宇宙大爆发的时代。特别是以GPT为代表的生成式大模型的诞生和不断进步,彻底改变了人们的工作和生活方式。程序员与AI协同工作写代码已成为常态,大模型不仅提高了工作效率,还为人类带来了无限的可能性。 AI元宇宙http://ai.toolxq.com/#/如同生物进化出眼睛打开了三维世界的元宇宙之后,GPT打开了人+AI工作模式的新时代,程序员的人生被划

AI学习指南机器学习篇-朴素贝叶斯处理连续特征和离散特征

AI学习指南机器学习篇-朴素贝叶斯处理连续特征和离散特征 在机器学习领域,朴素贝叶斯是一种常用的分类算法,它的简单性和高效性使得它在实际应用中得到了广泛的应用。然而,在使用朴素贝叶斯算法进行分类时,我们通常会面临一个重要的问题,就是如何处理连续特征和离散特征。因为朴素贝叶斯算法基于特征的条件独立性假设,所以对于不同类型的特征,我们需要采取不同的处理方式。 在本篇博客中,我们将探讨如何有效地处理

AI赋能天气:微软研究院发布首个大规模大气基础模型Aurora

编者按:气候变化日益加剧,高温、洪水、干旱,频率和强度不断增加的全球极端天气给整个人类社会都带来了难以估计的影响。这给现有的天气预测模型提出了更高的要求——这些模型要更准确地预测极端天气变化,为政府、企业和公众提供更可靠的信息,以便做出及时的准备和响应。为了应对这一挑战,微软研究院开发了首个大规模大气基础模型 Aurora,其超高的预测准确率、效率及计算速度,实现了目前最先进天气预测系统性能的显著