大脑也在强化学习!加州大学提出「价值决策」被大脑高效编码,登Neuron顶刊...

本文主要是介绍大脑也在强化学习!加州大学提出「价值决策」被大脑高效编码,登Neuron顶刊...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

bbf41b3ea315d025af5ad1548b1faa6e.png

来源:深度强化学习实验室
本文约1200字,建议阅读5分钟
本文带你了解一项新研究人和动物的决策离不开大脑,大脑决策要靠“价值信息”。
[ 导读 ] 人和动物的决策离不开大脑,大脑决策要靠「价值信息」。一项新研究揭示了这类关键信息更新和编码的详细机制,实验表明,它们被编入一个资源库,可以持久保存,长期调用。

我们每个人的一生都要做出大量的决定,小到「今天晚上吃什么」、「明天放假去哪里玩」,大到「这次战役怎么打」、「这部法律如何制定」。

这些决定的结果,要由决策者的大脑来给出最终裁决。

所以,大脑中负责这类「裁决」的关键区域,成为科学家们关注的重点。

2019 年,加州大学圣地亚哥分校的研究人员就发现了做出「价值决策」的大脑区域。

 433d0e51ad8cdaf27b6424ff9b756e3a.png

他们发现,这个区域被称为脾后皮层 (RSC),是用来做出「有价值的选择」的地方,比如决定今晚去哪家餐厅吃饭。然后,根据对今晚饭菜的喜好程度的新印象,用最新信息来更新RSC。

毕竟,只有及时更新信息,才能让大脑做出最正确的决策。

现在,这个团队在这个问题上又有新进展。该校生物科学系博士后 Ryoma Hattori 和 Takaki Komiyama 教授领导的新研究,揭示了大脑处理此类动态更新信息的详细机制。

 dfdaace93d620fef525f729c4c717a07.png

近日发表在Neuron期刊上的论文结果表明,RSC中的更新信息可以持久保存,就像一个可调用的资源库。

这些「持久信息」可以最有效地表示或「编码」有价值的信号,能够跨越大脑的不同区域。

9b002a04509d30a32b6cc4ebf09b684f.png

为了研究大脑活动如何表示基于价值的决策的细节,研究人员设置了强化学习实验。价值决策是人类大脑的关键机制,在精神分裂症、痴呆和成瘾等神经系统疾病中常常受损。

在实验中,研究人员小鼠提供了多个选项,对小鼠的选择以一定的概率奖励,并记录在强化学习过程中的相应大脑活动。

fb5bfb553103fe0c58b13d0eca36e5c6.png

由此产生的数据和网络模拟指出了持续编码在如何表示老鼠及其价值决定方面的重要性,以及 RSC 作为这项活动的纽带。

研究人员在论文中解释说:「这些结果表明,尽管信息编码是高度分布的,但并非所有神经活动中表示的信息都可以在每个区域中使用。这些结果表明,依赖于上下文的持久性信息,促进了可靠的信号编码,扩大了信息在大脑中的分布。」

e85b6583bfe447651c655d5f0e954178.png

研究人员发现,信息的持久性,可以让价值信号在大脑的不同区域得到最高效的编码,尤其是在脾后皮层中。图片来源:加州大学圣地亚哥分校 Komiyama 实验室

研究团队成员,论文作者之一Hattori表示,众所周知,神经元会在不同的活动模式中循环,一些神经元的活动会激增,而另一些则保持沉默。

5390466fdea3168002361990c6bca948.png

Ryoma Hattori

这些大脑活动模式已被证明与某些与任务相关的信息相关,例如决策的价值信息。由于 RSC 在连接多个大脑网络和功能方面发挥着核心作用,此次新发现进一步强化了2019年的成果。

“我们认为在小鼠大脑中,RSC的作用是价值信息的稳定储存库,当老鼠进行强化学习和决策时,RSC 会将价值信息分发到其他大脑区域,这些区域对于进一步处理价值信号至关重要。”

为了进一步测试他们的发现,Hattori 和 Komiyama 使用了他们在实验期间记录的超过 100000 次小鼠决策的「大数据」库。

研究人员对人工智能 (AI) 网络进行编程,模仿基于计算机的强化试验中的行为策略,得到了与现实世界的实验非常相似的结果。

574a46ea49bfb98db78ca53ed61d4b70.png

Takaki Komiyama

「当我们训练AI做同样的行为时,它采用了相同的策略和相同的方式来表示神经活动中的信息,」Komiyama 说

「这表明,我们的发现确实是神经回路执行这种行为的选择策略。AI和小鼠之间的这种相似性真的很有趣。」

参考资料:

https://neurosciencenews.com/value-decision-encoding-19695/

https://www.cell.com/cell/pdf/S0092-8674(19)30446-5.pdf

https://www.cell.com/neuron/pdf/S0896-6273(21)00891-6.pdf

编辑:于腾凯

f11ffd815d184888a7774048d0648d02.png

这篇关于大脑也在强化学习!加州大学提出「价值决策」被大脑高效编码,登Neuron顶刊...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/901022

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

高效+灵活,万博智云全球发布AWS无代理跨云容灾方案!

摘要 近日,万博智云推出了基于AWS的无代理跨云容灾解决方案,并与拉丁美洲,中东,亚洲的合作伙伴面向全球开展了联合发布。这一方案以AWS应用环境为基础,将HyperBDR平台的高效、灵活和成本效益优势与无代理功能相结合,为全球企业带来实现了更便捷、经济的数据保护。 一、全球联合发布 9月2日,万博智云CEO Michael Wong在线上平台发布AWS无代理跨云容灾解决方案的阐述视频,介绍了

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

高效录音转文字:2024年四大工具精选!

在快节奏的工作生活中,能够快速将录音转换成文字是一项非常实用的能力。特别是在需要记录会议纪要、讲座内容或者是采访素材的时候,一款优秀的在线录音转文字工具能派上大用场。以下推荐几个好用的录音转文字工具! 365在线转文字 直达链接:https://www.pdf365.cn/ 365在线转文字是一款提供在线录音转文字服务的工具,它以其高效、便捷的特点受到用户的青睐。用户无需下载安装任何软件,只

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学