【陈工笔记-Transformer】GAMLP图注意力多层感知器中注意力机制的理解

本文主要是介绍【陈工笔记-Transformer】GAMLP图注意力多层感知器中注意力机制的理解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

基本信息

标题:图注意力多层感知器
链接: Graph Attention Multi-Layer Perceptron | Papers With Code
作者:Wentao Zhang,Ziqi Yin,Zeang Sheng,Yang Li,Wen Ouyang,Xiaosen Li,Yangyu Tao,Zhi Yang,Bin Cui

要点记录
问题:

图神经网络GNN在许多基于图的应用中取得了巨大成功。然而,大规模图的高稀疏性阻碍了它们在工业场景中的应用。虽然针对大规模图提出了一些可扩展的GNN,但它们对每个节点采用固定的邻域,导致GNN模型在训练过程中对实际感知域不敏感。因此在稀疏区域内对节点采用大传播深度时,会面临过平滑问题。具体而言,现有的基于GNN的改进算法,存在特征传播方式缺乏灵活性的问题,无法对不同感受野(RF) 下的关联节点进行建模,会产生两种可能的结果:(1)长距离的依赖性由于 RF 过小而不能被充分利用;(2)由于RF过大而引入过平滑的噪声而失去了局部信息。

与先前的基于GNN的方法SIGN相比,SIGN解决了不同跳的信息没有充分利用的问题,它将不同跳的特征做了拼接操作,并将其输入至一个简单的MLP。但是,SIGN的缺点在于它并没有注意到不同节点所需要的传播深度不同的问题。如果跳数K取得非常大,那么后续拼接的特征都是过平滑特征,也就引入了很多噪声信息,最终导致模型性能不佳。

即,简单的将多跳的特征直接进行拼接或均值化操作可能不是最佳选择。一个更好的方法应该是使用自适应的聚合。

方案:

该团队提出了以节点自适应方式,来显式学习多尺度知识的重要性和相关性,开发了一种图形注意力多层感知器。它可以在节点的粒度上自动利用不同邻域的知识。GAMLP主要引入两种新颖的注意力机制来实现这一点:递归注意力跳跃知识注意力。这两种注意机制可以以节点自适应的方式捕获在不同传播深度处传播的信息之间的复杂相关性。因此,DGMLP具有与现有的简化和可扩展GNN模型相同的优点,同时由于其利用节点自适应RF的能力而提供了更好的性能。

具体技术

特征聚合机制提及两种,包括Recursive Attention和JK Attention。

Recursive Attention,在计算第l层特征的重要性时拼接了之前所有层的加权特征。这样计算得到的权重值的物理意义为:当前层特征有多少比例是之前所有层所不包含的信息。

JK Attention,将每个节点不同层的特征拼接并经过一个MLP进行变换,并将输出特征作为一个reference来衡量当前层的节点特征的重要性。这样计算得到的权重值的物理意义为:当前层的特征信息相较于所有层的特征信息,其信息量较大的特征占比有多少。

JKAttention注意力机制的深度解读

有关JK Attention注意力机制,可以延伸至 JKnet: Representation Learning on Graphs with Jumping Knowledge Networks。下面简要理解一下这篇文章的要点。

为了适应局部邻域属性和任务,该团队探索了一种架构——跳跃知识(JK)网络,该网络灵活地利用每个节点的不同邻域范围,以实现更好的结构感知表示。具体地,提出两个简单但有效的架构改变——跳跃连接(jump connections)和一个带有选择性和适应性的后聚合机制(a subsequent selective but adaptive aggregation mechanism)。

既然不同的结点需要的影响范围不一样,即不同的结点需要的邻域聚合信息程度不一样,那么就统一由模型自己来学习什么时候需要哪种程度的信息。在传统模型的基础上,将每一层的结果都联合起来输出到最后一层,这样模型就可以自己学习选择每个结点需要哪层的聚合信息。例如,对于图中心的稠密结点,可能只需要第二层的聚合信息就够了,而不需要后续的聚合信息,那么模型就会学习只关注第二层的邻居聚合信息而忽略其他层的聚合信息;而对于图边缘的稀疏结点,就可能需要更高层的聚合信息。基于此,对于不同的结点,每个结点能够自适应地选择最合适的聚合信息,即那一层的聚合信息。

(上述内容,借鉴自以下参考链接,主要用于自己的学习和记录,如果能够为大家提供些许帮助,属实幸运,内容持续更新ing)

参考链接:

1、GAT v.s. MLP

2、如何解决GNN的可扩展性与灵活性问题?

3、JKnet: Representation Learning on Graphs with Jumping Knowledge Networks

这篇关于【陈工笔记-Transformer】GAMLP图注意力多层感知器中注意力机制的理解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/651487

相关文章

JAVA线程的周期及调度机制详解

《JAVA线程的周期及调度机制详解》Java线程的生命周期包括NEW、RUNNABLE、BLOCKED、WAITING、TIMED_WAITING和TERMINATED,线程调度依赖操作系统,采用抢占... 目录Java线程的生命周期线程状态转换示例代码JAVA线程调度机制优先级设置示例注意事项JAVA线程

Java中自旋锁与CAS机制的深层关系与区别

《Java中自旋锁与CAS机制的深层关系与区别》CAS算法即比较并替换,是一种实现并发编程时常用到的算法,Java并发包中的很多类都使用了CAS算法,:本文主要介绍Java中自旋锁与CAS机制深层... 目录1. 引言2. 比较并交换 (Compare-and-Swap, CAS) 核心原理2.1 CAS

Spring Boot 集成 mybatis核心机制

《SpringBoot集成mybatis核心机制》这篇文章给大家介绍SpringBoot集成mybatis核心机制,本文结合实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值... 目录Spring Boot浅析1.依赖管理(Starter POMs)2.自动配置(AutoConfigu

GO语言zap日志库理解和使用方法示例

《GO语言zap日志库理解和使用方法示例》Zap是一个高性能、结构化日志库,专为Go语言设计,它由Uber开源,并且在Go社区中非常受欢迎,:本文主要介绍GO语言zap日志库理解和使用方法的相关资... 目录1. zap日志库介绍2.安装zap库3.配置日志记录器3.1 Logger3.2 Sugared

Redis的安全机制详细介绍及配置方法

《Redis的安全机制详细介绍及配置方法》本文介绍Redis安全机制的配置方法,包括绑定IP地址、设置密码、保护模式、禁用危险命令、防火墙限制、TLS加密、客户端连接限制、最大内存使用和日志审计等,通... 目录1. 绑定 IP 地址2. 设置密码3. 保护模式4. 禁用危险命令5. 通过防火墙限制访问6.

深入理解Redis线程模型的原理及使用

《深入理解Redis线程模型的原理及使用》Redis的线程模型整体还是多线程的,只是后台执行指令的核心线程是单线程的,整个线程模型可以理解为还是以单线程为主,基于这种单线程为主的线程模型,不同客户端的... 目录1 Redis是单线程www.chinasem.cn还是多线程2 Redis如何保证指令原子性2.

深入理解MySQL流模式

《深入理解MySQL流模式》MySQL的Binlog流模式是一种实时读取二进制日志的技术,允许下游系统几乎无延迟地获取数据库变更事件,适用于需要极低延迟复制的场景,感兴趣的可以了解一下... 目录核心概念一句话总结1. 背景知识:什么是 Binlog?2. 传统方式 vs. 流模式传统文件方式 (非流式)流

深入理解Go之==的使用

《深入理解Go之==的使用》本文主要介绍了深入理解Go之==的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录概述类型基本类型复合类型引用类型接口类型使用type定义的类型不可比较性谈谈map总结概述相信==判等操作,大

深入理解Mysql OnlineDDL的算法

《深入理解MysqlOnlineDDL的算法》本文主要介绍了讲解MysqlOnlineDDL的算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小... 目录一、Online DDL 是什么?二、Online DDL 的三种主要算法2.1COPY(复制法)

JAVA实现Token自动续期机制的示例代码

《JAVA实现Token自动续期机制的示例代码》本文主要介绍了JAVA实现Token自动续期机制的示例代码,通过动态调整会话生命周期平衡安全性与用户体验,解决固定有效期Token带来的风险与不便,感兴... 目录1. 固定有效期Token的内在局限性2. 自动续期机制:兼顾安全与体验的解决方案3. 总结PS