【陈工笔记-Transformer】GAMLP图注意力多层感知器中注意力机制的理解

本文主要是介绍【陈工笔记-Transformer】GAMLP图注意力多层感知器中注意力机制的理解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

基本信息

标题:图注意力多层感知器
链接: Graph Attention Multi-Layer Perceptron | Papers With Code
作者:Wentao Zhang,Ziqi Yin,Zeang Sheng,Yang Li,Wen Ouyang,Xiaosen Li,Yangyu Tao,Zhi Yang,Bin Cui

要点记录
问题:

图神经网络GNN在许多基于图的应用中取得了巨大成功。然而,大规模图的高稀疏性阻碍了它们在工业场景中的应用。虽然针对大规模图提出了一些可扩展的GNN,但它们对每个节点采用固定的邻域,导致GNN模型在训练过程中对实际感知域不敏感。因此在稀疏区域内对节点采用大传播深度时,会面临过平滑问题。具体而言,现有的基于GNN的改进算法,存在特征传播方式缺乏灵活性的问题,无法对不同感受野(RF) 下的关联节点进行建模,会产生两种可能的结果:(1)长距离的依赖性由于 RF 过小而不能被充分利用;(2)由于RF过大而引入过平滑的噪声而失去了局部信息。

与先前的基于GNN的方法SIGN相比,SIGN解决了不同跳的信息没有充分利用的问题,它将不同跳的特征做了拼接操作,并将其输入至一个简单的MLP。但是,SIGN的缺点在于它并没有注意到不同节点所需要的传播深度不同的问题。如果跳数K取得非常大,那么后续拼接的特征都是过平滑特征,也就引入了很多噪声信息,最终导致模型性能不佳。

即,简单的将多跳的特征直接进行拼接或均值化操作可能不是最佳选择。一个更好的方法应该是使用自适应的聚合。

方案:

该团队提出了以节点自适应方式,来显式学习多尺度知识的重要性和相关性,开发了一种图形注意力多层感知器。它可以在节点的粒度上自动利用不同邻域的知识。GAMLP主要引入两种新颖的注意力机制来实现这一点:递归注意力跳跃知识注意力。这两种注意机制可以以节点自适应的方式捕获在不同传播深度处传播的信息之间的复杂相关性。因此,DGMLP具有与现有的简化和可扩展GNN模型相同的优点,同时由于其利用节点自适应RF的能力而提供了更好的性能。

具体技术

特征聚合机制提及两种,包括Recursive Attention和JK Attention。

Recursive Attention,在计算第l层特征的重要性时拼接了之前所有层的加权特征。这样计算得到的权重值的物理意义为:当前层特征有多少比例是之前所有层所不包含的信息。

JK Attention,将每个节点不同层的特征拼接并经过一个MLP进行变换,并将输出特征作为一个reference来衡量当前层的节点特征的重要性。这样计算得到的权重值的物理意义为:当前层的特征信息相较于所有层的特征信息,其信息量较大的特征占比有多少。

JKAttention注意力机制的深度解读

有关JK Attention注意力机制,可以延伸至 JKnet: Representation Learning on Graphs with Jumping Knowledge Networks。下面简要理解一下这篇文章的要点。

为了适应局部邻域属性和任务,该团队探索了一种架构——跳跃知识(JK)网络,该网络灵活地利用每个节点的不同邻域范围,以实现更好的结构感知表示。具体地,提出两个简单但有效的架构改变——跳跃连接(jump connections)和一个带有选择性和适应性的后聚合机制(a subsequent selective but adaptive aggregation mechanism)。

既然不同的结点需要的影响范围不一样,即不同的结点需要的邻域聚合信息程度不一样,那么就统一由模型自己来学习什么时候需要哪种程度的信息。在传统模型的基础上,将每一层的结果都联合起来输出到最后一层,这样模型就可以自己学习选择每个结点需要哪层的聚合信息。例如,对于图中心的稠密结点,可能只需要第二层的聚合信息就够了,而不需要后续的聚合信息,那么模型就会学习只关注第二层的邻居聚合信息而忽略其他层的聚合信息;而对于图边缘的稀疏结点,就可能需要更高层的聚合信息。基于此,对于不同的结点,每个结点能够自适应地选择最合适的聚合信息,即那一层的聚合信息。

(上述内容,借鉴自以下参考链接,主要用于自己的学习和记录,如果能够为大家提供些许帮助,属实幸运,内容持续更新ing)

参考链接:

1、GAT v.s. MLP

2、如何解决GNN的可扩展性与灵活性问题?

3、JKnet: Representation Learning on Graphs with Jumping Knowledge Networks

这篇关于【陈工笔记-Transformer】GAMLP图注意力多层感知器中注意力机制的理解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/651487

相关文章

java中反射(Reflection)机制举例详解

《java中反射(Reflection)机制举例详解》Java中的反射机制是指Java程序在运行期间可以获取到一个对象的全部信息,:本文主要介绍java中反射(Reflection)机制的相关资料... 目录一、什么是反射?二、反射的用途三、获取Class对象四、Class类型的对象使用场景1五、Class

Nginx之upstream被动式重试机制的实现

《Nginx之upstream被动式重试机制的实现》本文主要介绍了Nginx之upstream被动式重试机制的实现,可以通过proxy_next_upstream来自定义配置,具有一定的参考价值,感兴... 目录默认错误选择定义错误指令配置proxy_next_upstreamproxy_next_upst

Spring排序机制之接口与注解的使用方法

《Spring排序机制之接口与注解的使用方法》本文介绍了Spring中多种排序机制,包括Ordered接口、PriorityOrdered接口、@Order注解和@Priority注解,提供了详细示例... 目录一、Spring 排序的需求场景二、Spring 中的排序机制1、Ordered 接口2、Pri

MySQL 缓存机制与架构解析(最新推荐)

《MySQL缓存机制与架构解析(最新推荐)》本文详细介绍了MySQL的缓存机制和整体架构,包括一级缓存(InnoDBBufferPool)和二级缓存(QueryCache),文章还探讨了SQL... 目录一、mysql缓存机制概述二、MySQL整体架构三、SQL查询执行全流程四、MySQL 8.0为何移除查

一文详解Java Condition的await和signal等待通知机制

《一文详解JavaCondition的await和signal等待通知机制》这篇文章主要为大家详细介绍了JavaCondition的await和signal等待通知机制的相关知识,文中的示例代码讲... 目录1. Condition的核心方法2. 使用场景与优势3. 使用流程与规范基本模板生产者-消费者示例

深入理解Apache Airflow 调度器(最新推荐)

《深入理解ApacheAirflow调度器(最新推荐)》ApacheAirflow调度器是数据管道管理系统的关键组件,负责编排dag中任务的执行,通过理解调度器的角色和工作方式,正确配置调度器,并... 目录什么是Airflow 调度器?Airflow 调度器工作机制配置Airflow调度器调优及优化建议最

一文带你理解Python中import机制与importlib的妙用

《一文带你理解Python中import机制与importlib的妙用》在Python编程的世界里,import语句是开发者最常用的工具之一,它就像一把钥匙,打开了通往各种功能和库的大门,下面就跟随小... 目录一、python import机制概述1.1 import语句的基本用法1.2 模块缓存机制1.

Redis主从/哨兵机制原理分析

《Redis主从/哨兵机制原理分析》本文介绍了Redis的主从复制和哨兵机制,主从复制实现了数据的热备份和负载均衡,而哨兵机制可以监控Redis集群,实现自动故障转移,哨兵机制通过监控、下线、选举和故... 目录一、主从复制1.1 什么是主从复制1.2 主从复制的作用1.3 主从复制原理1.3.1 全量复制

深入理解C语言的void*

《深入理解C语言的void*》本文主要介绍了C语言的void*,包括它的任意性、编译器对void*的类型检查以及需要显式类型转换的规则,具有一定的参考价值,感兴趣的可以了解一下... 目录一、void* 的类型任意性二、编译器对 void* 的类型检查三、需要显式类型转换占用的字节四、总结一、void* 的

Redis缓存问题与缓存更新机制详解

《Redis缓存问题与缓存更新机制详解》本文主要介绍了缓存问题及其解决方案,包括缓存穿透、缓存击穿、缓存雪崩等问题的成因以及相应的预防和解决方法,同时,还详细探讨了缓存更新机制,包括不同情况下的缓存更... 目录一、缓存问题1.1 缓存穿透1.1.1 问题来源1.1.2 解决方案1.2 缓存击穿1.2.1