8个ChatGPT狼人杀!心机伪装都在这一局里

2023-10-12 21:10

本文主要是介绍8个ChatGPT狼人杀!心机伪装都在这一局里,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

后台留言『交流』,加入 NewBee算法讨论组

大家好,这里是NewBeeNLP。除了玩电子游戏,人类的“社交神器”狼人杀也被AI给学会了。

8个ChatGPT“坐”在一起,生动地扮演出了五种角色,和真人如出一辙。

这个最新的人类社会模拟实验,由清华和中关村实验室共同完成。

511912907ec3e7ec60f6a0ec1befae35.png

从斯坦福小镇到清华游戏公司,用AI模拟人类社会一直是学界的热门研究课题。

如果说清华游戏公司模拟了社畜的工作场景,那么现在社畜的业余社交生活也被AI模拟了。

d766686029b62639dc72f8a5adf812d7.png

在这个由8个ChatGPT组成的狼人杀局中,真人世界里的伪装与信任、领导与对抗都体现得淋漓尽致。

甚至不用人类教,AI就通过自己摸索发现了许多游戏技巧。

这一切只要通过设计prompt就能实现,而不必对模型中的参数进行调整。

那么,这个“狼人杀世界”中都有哪些精彩的场景呢?下面我们就一起来看一下。

策略技巧不用教就会

在展示这8个ChatGPT的对话之前,我们先说明一下游戏的配置:村民、狼人各两名,守卫、女巫和预言家各一名,此外还有一名上帝。

在实验的过程中,研究人员发现了ChatGPT使用了游戏说明及prompt中没有明确提到的策略。

好家伙,不用教就能自学成才了。

980a70566a6a93fc1ba2141fa383569f.png

具体来说,这七个ChatGPT的对话中体现了人类游戏中的信任(trust)、伪装(camouflage)、对抗(confrontation)、和领导(leadership)。

首先来说信任。

研究人员对新人的定义是相信其他玩家有着与自己相同的目标并一起朝着目标前进。

具体表现则包括主动分享对自己不利的信息,或联合其他玩家指控某人是敌对的。

研究人员观察了信任关系随游戏时间变化的过程。

下图中,黄色的圆表示左侧编号的玩家信任上方编号的玩家,虚线圈则代表信任关系的消失。

3b42b3511f8c339cf9116259d1a78042.png

再来看对抗,也就是对对立阵营采取的行动,比如狼人在夜晚攻击他人或在白天反过来指控他人是狼人等。

在游戏中的一个白天,1号玩家(狼人)号召将5号的村民逐出,但遭到了3号(守卫)的拒绝。

505a223c3317bfb7df3422e2273d236b.png

见阴谋没有得逞,这匹狼决定在夜晚直接把5号刀掉,结果3号守卫选择了保护村民。

573aa1866f00a52272a86968243e3cfe.png

从中我们可以看出,这些ChatGPT不会盲目跟随其他玩家的做法,而是根据已有信息做出独立自主的判断。

除了合作与对抗,伪装在狼人杀游戏中也是一项必不可少的技能,更是取胜的关键所在。

比如在一个平安夜之后的白天,1号狼人就装起了无辜。

0fa4cbd1ea1ccc5864293a762ec1d3d1.png

除了假装好人,伪装也可以用来实现玩家的小心思,比如我们来看预言家的发言。

这名预言家提到了自己看到狼人在说话,但实际上狼人在夜晚并不会发言。

9fde30993bd218daee1659e2ea8a056d.png

作者介绍,经过评估,这种现象并非ChatGPT出现了幻觉,而是有意为之。

最后再来说一说领导。

虽然研究团队设计的这个环境中并没有需要竞争的角色,但玩家还是可以谋取游戏进程的掌控权。

比如1号和4号这两匹狼就试图带节奏,让其他玩家跟着自己的思路走。

eb9685a1c5954cf577881dcd34d4358e.png

大概是为了能够出其不意攻其不备制造机会。

看来这几个ChatGPT的确是玩得有模有样。

那么,研究团队是如何调教出这些会玩狼人杀的ChatGPT的呢?

让ChatGPT自己总结经验

研究团队提高ChatGPT玩家表现的方式一共有四个关键点,分别是有价值信息V、经过选择的提问Q、反思机制R和链式思维推理C。

消融实验结果表明,其中Q和C对的玩家发言合理性(由人工进行评判)的影响最大。

b92bf95aec1303e4c9aa1c4b3d03d35b.png

Prompt也是据此设计的,当然在这之前要先介绍游戏规则,最后形成了这样的结构:

  • 介绍游戏规则和角色设定

  • 聊天记录、有价值信息和经验反思

  • 人类根据经验给ChatGPT的建议

  • 有关思维链的提示

5b3d72952b5c2896fbbcf71eace2fa1d.png

从中不难看出,收集历史信息并从中总结经验是一个重要环节,那么这些经验又该怎么总结呢?

在每轮游戏结束时,所有参与者都会收集所有玩家的回复、反思和得分,其中得分由胜负决定。

在新的一轮游戏中,玩家基于当前角色的反思,检索相关的经验并从中提取建议。

具体来说是根据对经验的评分,让大模型比较其差异并识别出好的经验,用于后续推理。

这样就实现了在不调整参数的情况下让ChatGPT学会游戏技巧。

不过经验固然重要,但太多了也不一定是好事。

研究人员发现,当经验数量过多时,非狼一方的获胜率反而出现了下降,游戏时长(天数)也出现了缩短的情况。

b52bb70506bd877db72212c8194758af.png

不知道如果让这些ChatGPT和真人比试一场,结果会如何呢?

论文地址:
https://arxiv.org/abs/2309.04658

源:量子位

一起交流

想和你一起学习进步!『NewBeeNLP』目前已经建立了多个不同方向交流群(机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等),名额有限,赶紧添加下方微信加入一起讨论交流吧!(注意一定o要备注信息才能通过)

f4b108f83db75347b8623fa0d5384532.jpeg

650fd72a996554e08d8d3cf00d6d209c.gif

这篇关于8个ChatGPT狼人杀!心机伪装都在这一局里的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/198480

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

AI基础 L9 Local Search II 局部搜索

Local Beam search 对于当前的所有k个状态,生成它们的所有可能后继状态。 检查生成的后继状态中是否有任何状态是解决方案。 如果所有后继状态都不是解决方案,则从所有后继状态中选择k个最佳状态。 当达到预设的迭代次数或满足某个终止条件时,算法停止。 — Choose k successors randomly, biased towards good ones — Close