DeepMind关系推理网络

2024-05-07 14:32
文章标签 关系 网络 推理 deepmind

本文主要是介绍DeepMind关系推理网络,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

简介

本文用一个普适的关系网络RNs(Relation Networks)来解决“关系推理”(relational reasoning)问题。其使用的模型结构简单,效果远胜已有算法,甚至超出人类表现

论文于2017年6月5日在arxiv发布。由于其原理简明,爱好者们很快给出了pytorch实现、keras实现以及tensorflow实现。

关系推理问题

关系推理问题由三部分组成。

  1. 一系列事实,即推理的素材。可以是:

    • 一张图片:红色的球,黄色的圆柱,蓝色的立方体。
    • 一组场景信息:每个物体的类别,颜色,尺寸,位置。
    • 几个句子:Mike拿着足球。Mike去了办公室。
    • 一段数据:几个球在物理系统中弹跳,其中某几个有隐形杆相连。给出这些球的实时位置。
  2. 一个问题,作为推理的提示。由于强调关系,这些问题都涉及不止一个对象。例如:

    • 红色和黄色物体是否为同一类?
    • 哪个物体离蓝色球最远?
    • 足球在哪里?
    • 那些物体在运动时是相连的?
  3. 一个回答,即推理的结果。例如:

    • (红色和黄色物体)是(同一类)。
    • 黄圆柱。
    • (足球在)办公室。
    • A球和B球(是相连的)。

在训练集中,每组数据包含1.2.3;在测试集中,每组数据包含1.2, 要求回答出3。
说明:问题和回答不局限于自然语言。也可能使用结构化数据表示。

网络结构

系统

推理网络可以用下图表述。
这里写图片描述

事实O

问题Q都经过不同的embedding网络提取特征变为o,q

。这l两者构成系统的processing部分。

对于不同类别的输入,embedding可能是CNN(图像)或LSTM(自然语言)。

两个特征送入reasoning部分,推理出回答a

传统的推理网络中,reasoning部分可能是MLP,LSTM,或者带有attention的LSTM。

关系网络RN

本文使用关系网络(Relational Network)实现reasoning部分。
这里写图片描述

其理念非常直观
- 把事实特征分解成一系列对象o={o1,o2...on}


- 把对象两两配对,和问题特征q组成三元组
- 将三元组送入一个统一的MLP网络g
- 得到的结果相加,再次送入一个MLP网络f,输出回答a

 

可以用一个公式表达:

a=f(∑g(oi,oj,q))

 

RN的这种结构明确地表达了关系推理的两个思想
1. 最终答案和成对的对象有关
2. 问题本身也会影响如何考察对象对

举例:如果问题中包含“多远”,则应该关注两个对象的距离;如果问题中包含“和…颜色相同”,则应该关注两个对象的颜色。

具体实现

本文的实验设置非常详尽,具体可参看附录部分。这里只概述几个例子,大致建立基本概念。

特征提取

图像

不同任务均使用CNN对图像进行编码。差别仅在于卷积层具体参数。

使用如下步骤获得对象oi


- 原始图像归一化尺寸
- 经过一个卷积层获得p×q×k的结果
- 再经过Batch Normalization层和ReLU
- 结果中每个像素位置的k维特征 + 该像素归一化位置 = k+2维oi

1

试验中k=24。

自然语言

首先每个单词经过特征提取网络转化为32位特征。
之后把句子经过LSTM转换成特征,LSTM的单元数为32,128或256。

对于由多个句子组成的事实,每个句子的特征+该句子在事实集合中位置 = 对象oi


对于问题,该问句的特征即为q

结构化数据

将每个物体的结构化数据(位置、颜色、尺寸、材质)直接作为对象特征。

RN网络

不同任务使用RN网络结构类似,以下举出一例。

g

:4层MLP,每层256个节点;ReLU激活。
f

:3层MLP,各层节点256-256-29;50%的drop-out;ReLU激活;softmax输出各种答案的概率。

结论

比起已有系统的特征提取部分(ResNet,VGG),本文的特征提取模型简单,却仍取得更好效果。这证明:

关系推理问题的难点在“推理”部分,而非信息处理部分。

对于非关系推理类问题,本文系统与已有系统表现类似;但在关系推理问题中,本文远远胜出。说明:

本文RN网络的成对结构是解决关系推理的关键。

作者在未来工作的展望中,希望把RN结构应用到更广泛的问题中,例如强化学习的复杂场景理解,社交网络建模,抽象问题求解等。还可以利用attention机制缩减对象对的规模,以节约资源。

这篇关于DeepMind关系推理网络的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/967620

相关文章

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》:本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为

MYSQL关联关系查询方式

《MYSQL关联关系查询方式》文章详细介绍了MySQL中如何使用内连接和左外连接进行表的关联查询,并展示了如何选择列和使用别名,文章还提供了一些关于查询优化的建议,并鼓励读者参考和支持脚本之家... 目录mysql关联关系查询关联关系查询这个查询做了以下几件事MySQL自关联查询总结MYSQL关联关系查询

SSID究竟是什么? WiFi网络名称及工作方式解析

《SSID究竟是什么?WiFi网络名称及工作方式解析》SID可以看作是无线网络的名称,类似于有线网络中的网络名称或者路由器的名称,在无线网络中,设备通过SSID来识别和连接到特定的无线网络... 当提到 Wi-Fi 网络时,就避不开「SSID」这个术语。简单来说,SSID 就是 Wi-Fi 网络的名称。比如

Java实现任务管理器性能网络监控数据的方法详解

《Java实现任务管理器性能网络监控数据的方法详解》在现代操作系统中,任务管理器是一个非常重要的工具,用于监控和管理计算机的运行状态,包括CPU使用率、内存占用等,对于开发者和系统管理员来说,了解这些... 目录引言一、背景知识二、准备工作1. Maven依赖2. Gradle依赖三、代码实现四、代码详解五

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

ASIO网络调试助手之一:简介

多年前,写过几篇《Boost.Asio C++网络编程》的学习文章,一直没机会实践。最近项目中用到了Asio,于是抽空写了个网络调试助手。 开发环境: Win10 Qt5.12.6 + Asio(standalone) + spdlog 支持协议: UDP + TCP Client + TCP Server 独立的Asio(http://www.think-async.com)只包含了头文件,不依

poj 3181 网络流,建图。

题意: 农夫约翰为他的牛准备了F种食物和D种饮料。 每头牛都有各自喜欢的食物和饮料,而每种食物和饮料都只能分配给一头牛。 问最多能有多少头牛可以同时得到喜欢的食物和饮料。 解析: 由于要同时得到喜欢的食物和饮料,所以网络流建图的时候要把牛拆点了。 如下建图: s -> 食物 -> 牛1 -> 牛2 -> 饮料 -> t 所以分配一下点: s  =  0, 牛1= 1~

poj 3068 有流量限制的最小费用网络流

题意: m条有向边连接了n个仓库,每条边都有一定费用。 将两种危险品从0运到n-1,除了起点和终点外,危险品不能放在一起,也不能走相同的路径。 求最小的费用是多少。 解析: 抽象出一个源点s一个汇点t,源点与0相连,费用为0,容量为2。 汇点与n - 1相连,费用为0,容量为2。 每条边之间也相连,费用为每条边的费用,容量为1。 建图完毕之后,求一条流量为2的最小费用流就行了

poj 2112 网络流+二分

题意: k台挤奶机,c头牛,每台挤奶机可以挤m头牛。 现在给出每只牛到挤奶机的距离矩阵,求最小化牛的最大路程。 解析: 最大值最小化,最小值最大化,用二分来做。 先求出两点之间的最短距离。 然后二分匹配牛到挤奶机的最大路程,匹配中的判断是在这个最大路程下,是否牛的数量达到c只。 如何求牛的数量呢,用网络流来做。 从源点到牛引一条容量为1的边,然后挤奶机到汇点引一条容量为m的边

POJ1269 判断2条直线的位置关系

题目大意:给两个点能够确定一条直线,题目给出两条直线(由4个点确定),要求判断出这两条直线的关系:平行,同线,相交。如果相交还要求出交点坐标。 解题思路: 先判断两条直线p1p2, q1q2是否共线, 如果不是,再判断 直线 是否平行, 如果还不是, 则两直线相交。  判断共线:  p1p2q1 共线 且 p1p2q2 共线 ,共线用叉乘为 0  来判断,  判断 平行:  p1p