DeepMind成功使用深度强化学习技术完美控制核聚变反应堆!

本文主要是介绍DeepMind成功使用深度强化学习技术完美控制核聚变反应堆!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

d6943045fc71cfcc8479201dea393b9a.png

本文经AI新媒体量子位(公众号ID:qbitai)授权转载,转载请联系出处。
本文约1400字,建议阅读5分钟
DeepMind开发出世界上第一个深度强化学习AI。

DeepMind在蛋白质折叠问题上实现巨大突破后,目标又转向核聚变了。

最近,它开发出了世界上第一个深度强化学习AI——可以在模拟环境和真正的核聚变装置(托卡马克)中实现对等离子体的自主控制。

陌生名词不要急,后面马上解释。

ffccb607a878132bcdb40e9dcb6c2993.png

这比传统的计算机控制要更高效且精准,成果登上今天的Nature。

0fb28baaa61560ad8612d1764989aae2.png

作为强化学习最具有挑战性的一个应用,这一成果也对加速可控核聚变有很大意义。

用强化学习控制核聚变反应

核聚变是未来最有潜力的清洁能源:只靠一个原子核就能产生巨大能量,除了相对少量的放射性废物(可在一个世纪内分解),不会产生任何温室气体。

c3dd7d16e962208c0b4eaac9d79a397d.png

但要在地球上实现这一反应无比困难,需要制造一个极端高温和高压的条件,在其中创建一个由裸原子核组成的“等离子体”。

磁约束聚变装置——托卡马克(tokamak),是最有希望的一个实现方法。

它是一个环形反应堆,可以在超过1亿摄氏度的环境下把氢加热(superheat)成等离子体的状态。

2e01b0091915dfcd4f56cd968577d529.png

托卡马克内部图

由于等离子体温度太高,任何材料都无法容纳,要通过强大的磁场将它悬浮在托卡马克内部。

在操作磁线圈时必须非常仔细,因为一旦碰壁,就可能导致容器损坏,并减缓聚变反应。

而一个托卡马克装共有19个磁线圈,一秒需要调整线圈及其电压数千次。

传统的装置中,每个线圈配备单独的控制器。

每当研究人员想要改变等离子体的结构,尝试不同的形状以产生更高的能量时,就需要大量的工程和设计工作。

DeepMind这个强化学习系统则可以一次控制全部19个线圈,并精确操纵等离子体自主呈现各种形状,呈现产生科学家们一直在探索的更高能量的新配置:

比如下图中第二个“负三角”以及第四个“雪花”(这个形状可以通过将废能量分散到托卡马克壁上的不同接触点来降低冷却成本)。

以及第一个“droplets”,这也是第一次在托卡马克内同时稳定两个等离子体。

03d644915b38f26258c074a04b2a8b85.gif

这个AI系统由DeepMind和瑞士洛桑联邦理工学院等离子体中心的物理学家共同完成。

瑞士中心的一位成员表示:“这里面有的形状已经逼近装置的极限,很可能对系统造成损坏,如果不是AI给的信心,我们可能不会冒这个险。”

这个AI是在模拟器中通过反复试验来训练的。

在核聚变研究中,模拟器非常有必要,因为目前运行的反应堆一次只能维持等离子体最多几秒钟,之后需要时间来重置。

5f8b198c14b74cd26f350fd14cdb6152.png

不过一个问题是:该模拟器并没有准确捕获真实托卡马克中存在的所有变量,能迁移到真正的托卡马克上吗?

对此,DeepMind研究员表示,通过用随机数表示足够训练出一个灵活的AI。

另一个问题是:为了保持对托卡马克内部等离子体的控制,控制算法必须能够做出极快的决定,在短短几秒钟内对磁场进行调整。但许多人工智能系统在如此高速的环境下需要很长时间才能做出预测。

为此,该团队先训练了一个大型神经网络,它可以对磁场的变化如何塑造等离子体进行长程预测(longer-term prediction)。

然后用这个网络来训练一个远小得多的系统,学习执行第一个网络所推荐的决策的最佳方法。

这个较小的网络能与托卡马克控制系统直接交互,在不到50微秒(50百万分之一秒)的时间内做出决定。

最后,作者表示,虽然这个成果意义非凡,但只是朝着人类实现可控核聚变迈出了一小步。

比如实现一秒钟的实时运行需要模拟托卡马克数小时的时间,而它的条件每天都可能发生变化,算法还需各方面改进。

此外,还要看现在这个系统能否转移到更大的托卡马克装置中。

聚变能源何时实现商用还很难说,但DeepMind断言,人工智能可以加速这一过程。

不知道它能否再次像AlphaFold一样,在核聚变领域实现惊艳全世界的新成果。

拭目以待。

(也有一些网友在担心,要是控制核聚变的AI哪天想不开……)

论文地址:
https://www.nature.com/articles/s41586-021-04301-9

参考链接:
[1]https://venturebeat.com/2022/02/16/deepmind-applies-ai-to-controlling-nuclear-fusion-reactors/ 

[2]https://fortune.com/2022/02/16/deepmind-ai-nuclear-fusion-reactor-control/

编辑:于腾凯

d82e82a42456f998687f6870c8381bc0.png

这篇关于DeepMind成功使用深度强化学习技术完美控制核聚变反应堆!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/900950

相关文章

如何使用 Python 读取 Excel 数据

《如何使用Python读取Excel数据》:本文主要介绍使用Python读取Excel数据的详细教程,通过pandas和openpyxl,你可以轻松读取Excel文件,并进行各种数据处理操... 目录使用 python 读取 Excel 数据的详细教程1. 安装必要的依赖2. 读取 Excel 文件3. 读

SpringBoot请求参数接收控制指南分享

《SpringBoot请求参数接收控制指南分享》:本文主要介绍SpringBoot请求参数接收控制指南,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Spring Boot 请求参数接收控制指南1. 概述2. 有注解时参数接收方式对比3. 无注解时接收参数默认位置

解决Maven项目idea找不到本地仓库jar包问题以及使用mvn install:install-file

《解决Maven项目idea找不到本地仓库jar包问题以及使用mvninstall:install-file》:本文主要介绍解决Maven项目idea找不到本地仓库jar包问题以及使用mvnin... 目录Maven项目idea找不到本地仓库jar包以及使用mvn install:install-file基

Python使用getopt处理命令行参数示例解析(最佳实践)

《Python使用getopt处理命令行参数示例解析(最佳实践)》getopt模块是Python标准库中一个简单但强大的命令行参数处理工具,它特别适合那些需要快速实现基本命令行参数解析的场景,或者需要... 目录为什么需要处理命令行参数?getopt模块基础实际应用示例与其他参数处理方式的比较常见问http

C 语言中enum枚举的定义和使用小结

《C语言中enum枚举的定义和使用小结》在C语言里,enum(枚举)是一种用户自定义的数据类型,它能够让你创建一组具名的整数常量,下面我会从定义、使用、特性等方面详细介绍enum,感兴趣的朋友一起看... 目录1、引言2、基本定义3、定义枚举变量4、自定义枚举常量的值5、枚举与switch语句结合使用6、枚

使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)

《使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)》PPT是一种高效的信息展示工具,广泛应用于教育、商务和设计等多个领域,PPT文档中常常包含丰富的图片内容,这些图片不仅提升了... 目录一、引言二、环境与工具三、python 提取PPT背景图片3.1 提取幻灯片背景图片3.2 提取

Spring Security+JWT如何实现前后端分离权限控制

《SpringSecurity+JWT如何实现前后端分离权限控制》本篇将手把手教你用SpringSecurity+JWT搭建一套完整的登录认证与权限控制体系,具有很好的参考价值,希望对大家... 目录Spring Security+JWT实现前后端分离权限控制实战一、为什么要用 JWT?二、JWT 基本结构

Android实现两台手机屏幕共享和远程控制功能

《Android实现两台手机屏幕共享和远程控制功能》在远程协助、在线教学、技术支持等多种场景下,实时获得另一部移动设备的屏幕画面,并对其进行操作,具有极高的应用价值,本项目旨在实现两台Android手... 目录一、项目概述二、相关知识2.1 MediaProjection API2.2 Socket 网络

使用Python实现图像LBP特征提取的操作方法

《使用Python实现图像LBP特征提取的操作方法》LBP特征叫做局部二值模式,常用于纹理特征提取,并在纹理分类中具有较强的区分能力,本文给大家介绍了如何使用Python实现图像LBP特征提取的操作方... 目录一、LBP特征介绍二、LBP特征描述三、一些改进版本的LBP1.圆形LBP算子2.旋转不变的LB

Maven的使用和配置国内源的保姆级教程

《Maven的使用和配置国内源的保姆级教程》Maven是⼀个项目管理工具,基于POM(ProjectObjectModel,项目对象模型)的概念,Maven可以通过一小段描述信息来管理项目的构建,报告... 目录1. 什么是Maven?2.创建⼀个Maven项目3.Maven 核心功能4.使用Maven H