本文主要是介绍【杂记】裂脑人实验和语言模型幻觉,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
【杂记】裂脑人实验和语言模型幻觉
模型的自主意识在哪里,人的自我认知在哪里?自然而然的,“裂脑人” 这个词突然出现在我脑海里。然后随意翻了翻相关的文章,觉得这个问题和目前大模型面临的幻觉问题也高度相关,遂随笔记录。
裂脑人
什么是裂脑人?人的大脑左右半脑本来是一个整体,因为先天或者后天的原因让左右半脑分开不产生连接,就是“裂脑”。过去这个方法被作为控制恶性癫痫的治疗手段。
一些铺垫知识
- 我们也知道左脑和右脑负责的功能是不一样的。比如语言组织,思考推理主要由左脑负责,右脑负责一些空间推理,直觉等
- 左脑控制人身体的右半边:比如你的右眼,你的右胳膊
- 相应的,右脑控制你身体的左半边:比如你的左眼,右胳膊
两个实验
下面加扎尼加是对于受试者(后天裂脑人)的两个实验
挥手实验->语言编造
实验者给受试者的“左眼”展示“挥手”一词(让右脑知道“挥手”信息),并让受试者按照信息行事。这时受试者便挥了挥手。
此时,实验者准备刁难一下受试者的左脑(左脑没见过“挥手”,但是知道自己挥手了),实验者问受试者你为什么刚才挥手?受试者此时犹豫了片刻之后回复到:以为刚才看见了一个朋友,所以挥了挥手。
联想实验->语言编造
实验者让受试者左眼看到一幅雪景,右眼看到一只鸡脚,然后让他在桌子上的卡片中,左右手各挑选一张有关联的卡片。
受试者由右脑控制的左手挑的是一个铲雪的铲子,而由左脑控制的右手则是挑了一只鸡。
而这一次受试者的解释是:因为看到了鸡爪所以挑选鸡,而挑铲子是因为要用它打扫鸡厩!
(这时因为受试者用语言解释的时候只能依赖左脑,而左脑知道右眼见过鸡,却不知道左眼见过雪景)
裂脑人的幻觉
上面两个例子中,受试者都产生了幻觉!产生幻觉的原因,都是由于负责推理和表达的左脑不知道仅仅传递给右脑的信息,然后做出了臆想。
模型的幻觉
铺垫了这么久,可以谈谈大模型了。我们都知道大语言模型也经常产生幻觉!当然大语言模型的幻觉的定义不是那么统一,姑且这么称呼吧。
在过去的实验中,我发现无论给模型过多的信息或者过少的信息,模型都容易产生严重的幻觉!
比如下面有一段文字(省略了很多内容)
Spam msubi是夏威夷一种流行的小吃和午餐食物,它是由... ...在日语中又被称作 ...
我问大模型,请提取上面这段内容中和 (Spam,流行小吃,午餐食物, 夏威夷) 相关的内容,大模型可以正确的回答 Spam是夏威夷一种流行小吃和午餐食物
但是!如果我问大模型请提取上面这段内容中和 (Spam,罐装,流行小吃,午餐食物, 夏威夷)相关的内容,大模型则会错误的回答 Spam是夏威夷一种流行小吃和罐装午餐食物
当然上面的例子只是在我之前某次实验提供过多信息发现模型容易产生幻觉,相应的那些由于缺少信息产生的幻觉更是数不胜数。
解决幻觉
从这里开始都是我的瞎说~
- 首先就是信息不能过多也不能过少,在之前的实践中我就是这么进行的,并且发现这样做确实能够一定程度的缓解幻觉。作为一个头疼医头,脚疼医脚的策略。
- 我猜想人的大脑能够独立并协同工作也是正常人抑制幻觉的重要能力。比如说 (a)裂脑人只依赖左脑回答问题比正常人左右脑协同工作更多产生幻觉 (b)当人似醒未醒,或者被酒精麻痹了状态下(此时大脑的前额叶并没有苏醒进入工作状态或者是酒精中毒了),人总是会胡言乱语产生大量幻觉。胡说八道的大模型类比成大脑各部分还没配合起来的人类。 人的大脑各个部分不仅可以独立工作,还可以互相监督。而目前的语言模型,并没有类似的能力(多agent的操作可能有点类似)。
这篇关于【杂记】裂脑人实验和语言模型幻觉的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!