《Predict then Propagate: Graph Neural Networks meet Personalized PageRank》论文阅读笔记

本文主要是介绍《Predict then Propagate: Graph Neural Networks meet Personalized PageRank》论文阅读笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章:Predict then Propagate: Graph Neural Networks meet Personalized PageRank

出处:ICLR 2019

作者:Johannes Klicpera, Aleksandar Bojchevski & Stephan Gunnemann

机构:Technical University of Munich, Germany

1. 背景

传统GCN在节点分类中达到了不错的效果,但只能在将层数限制在2-3层,加深层数会导致两个问题:

  1. 出现过平滑现象:即最后所有节点趋向同一个值。
  2. 随着层数的加深,参数量也呈指数级增长,同时所利用的邻域的大小难以扩展。

因此提出:

       使用基于图卷积网络GCN与PageRank之间的关系来推导基于个性化PageRank的改进传播方案。利用这种传播程序来构建一个简单的模型,神经网络预测的个性化传播模型(PPNP)及其快速逼近模型APPNP。

2. introduction

链路预测,图分类和半监督节点分类等可以利用图上的深度学习算法。 例如:

无监督方法:节点嵌入方法使用随机游走或矩阵分解直接训练单个节点嵌入,通常不使用节点特征并且通常以无监督的方式使用,即不利用节点类。

有监督方法:频谱图卷积神经网络,消息传递(或邻居聚合)算法,RNN神经网络,注意力机制等。

所有这些方法仅对每个节点使用非常有限的邻域信息。希望有更大的邻域来为模型提供更多信息,尤其是对于外围或稀疏标记设置中的节点。

这些算法使用的邻域大小(即它们的范围)并不是微不足道的,因为该方案中的邻域聚合本质上是 Laplacian smoothing 的一种,并且太多层会导致过度smoothing。

根据图卷积网络(GCN)的消息传递算法与随机游走之间的关系,可以看出随着层数的增加,GCN会收敛到该随机游走的极限分布。 极限分布是整个图的一个属性,没有考虑随机游走的起始(根)节点。因此,不适合描述根节点的邻居。因此,GCN的性能必然会因大量层(或聚合/传播步骤)而下降。

为了解决这个问题,作者根据极限分布与PageRank之间的内在联系提出了一种新的算法:PPNP和APPNP。

  • 该算法利用从个性化PageRank派生的传播方案。
  • 该算法增加了传回根节点的机会,从而确保PageRank分数对每个根节点的局部邻域进行编码。
  • 传播方案使我们能够平衡以下方面的需求:保留局部性(即,保持靠近根节点以避免过度平滑),以及平衡来自大型社区的信息的需求。 我们表明,这种传播方案允许使用更多(实际上是无限多个)传播步骤,而不会导致过度平滑。
  • 与大多数竞争模型相比,我们的模型可实现最新的结果,同时需要更少的参数和更少的训练时间,并且计算复杂度与边沿数量呈线性关系。

3. 图卷积网络(GCN)

存在的缺陷:

  1. 如果使用了太多的层,则通过求平均的聚合会导致过度平滑。 因此,它失去了对 local neighborhood的关注。
  2. 使用更大的邻域必然会增加神经网络的可学习参数的深度和数量。

4. 从消息传递到个性化PageRank

原始的PageRank算法

考虑根节点的信息和传播方式的个性化PageRank算法

5. 从个性化PageRank到神经网络预测的个性化传播(PPNP)

 为了将上述影响力分数用于半监督分类,作者根据每个节点的自身特征生成预测,然后通过个性化PageRank方案传播它们,以生成最终预测。

 PPNP从传播方案中分离出了用于生成预测的神经网络。

这种分离解决了上面提到的第二个问题:神经网络的深度现在完全独立于传播算法。

个性化PageRank甚至可以有效地使用无限多个邻域聚合层,这在传统消息传递框架中显然是不可能的。

分离使我们可以灵活地使用任何方法来生成预测,例如用于图像图形的深层卷积神经网络。

6. 神经网络预测的近似个性化传播(APPNP)

APPNP通过通过幂迭代逼近主题敏感的PageRank来实现线性计算复杂性。 虽然PageRank的功效迭代与常规的随机游走相关,但与主题相关的PageRank的功效迭代与重新启动的随机游走有关。 因此,主题敏感的PageRank变体的每次幂迭代(随机遍历/传播)步骤都可以通过以下式子实现:

在PPNP和APPNP中,可以通过传送概率α来调整影响每个节点的邻域的大小。 可以自由地使我们能够针对不同类型的网络调整模型。

7. 实验

数据集

实验效果

。。。。。。

8. Conclusion

  • 提出了神经网络预测的个性化传播(PPNP)及其快速逼近APPNP。
  • 通过考虑GCN和PageRank之间的关系并将其扩展到个性化PageRank来推导此模型。
  • 这个简单的模型将预测和传播解耦,并解决了许多消息传递模型中固有的有限范围问题,而无需引入任何其他参数。
  • 它使用来自较大的可调整的(通过传送概率α)邻域的信息对每个节点进行分类。
  • 该模型具有高效的计算能力,并且优于迄今为止针对类似GCN的模型所做的最彻底研究中针对多张图进行半监督分类的几种最新方法。
  • 对于以后的工作,将PPNP与使用的更复杂的神经网络相结合会很有趣。在计算机视觉或自然语言处理中。

这篇关于《Predict then Propagate: Graph Neural Networks meet Personalized PageRank》论文阅读笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/336252

相关文章

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个

查看提交历史 —— Git 学习笔记 11

查看提交历史 查看提交历史 不带任何选项的git log-p选项--stat 选项--pretty=oneline选项--pretty=format选项git log常用选项列表参考资料 在提交了若干更新,又或者克隆了某个项目之后,你也许想回顾下提交历史。 完成这个任务最简单而又有效的 工具是 git log 命令。 接下来的例子会用一个用于演示的 simplegit

记录每次更新到仓库 —— Git 学习笔记 10

记录每次更新到仓库 文章目录 文件的状态三个区域检查当前文件状态跟踪新文件取消跟踪(un-tracking)文件重新跟踪(re-tracking)文件暂存已修改文件忽略某些文件查看已暂存和未暂存的修改提交更新跳过暂存区删除文件移动文件参考资料 咱们接着很多天以前的 取得Git仓库 这篇文章继续说。 文件的状态 不管是通过哪种方法,现在我们已经有了一个仓库,并从这个仓