本文主要是介绍图表征学习——Graph Embedding,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
图表征学习的目的是将图中的节点嵌入低维的表征,并有效地保留图的结构信息。
Graph Embedding是实现图表征学习的方法,即Graph Embedding的目的也是将图结构转换为节点的低维嵌入表示,在这个过程中,保留图的拓扑结构信息尤为重要。
图的结构可以分为不同的类别,不同类别拥有不同粒度的图表征,经常用到的图结构有邻域结构、高阶接近度和群落结构。
邻域结构
基于短时随机行走中出现的节点分布与自然语言中单词分布相似的发现,DeepWalk采用了随机行走来捕捉邻域结构,然后对于随机行走产生的每个行走序列,按照Skip-Gram模型,最大化行走序列中邻居节点出现的概率。Node2Vec定义了一个灵活的节点图邻域概念,并设计了一种二阶随机行走策略来对邻域节点进行抽样,从而在广度优先抽样和深度优先抽样之间平稳插值。
高阶接近度
LINE被提出用于大规模的网络嵌入,LINE可以保留一阶接近度和二阶接近度。一阶接近度指的是观察到的两个节点之间成对节点的接近度。二阶接近度是由两个节点的“环境”(邻居节点)的相似性确定的。在衡量两个节点之间的关系方面,它们都很重要。从本质上说,由于LINE是基于浅层模型的,因此其表现能力有限。SDNE是一个用于网络嵌入的深度模型,其目的也是捕捉一阶接近度和二阶接近度。SDNE使用具有多个非线性层的深度自编码器架构来保留二阶接近度。为了保留一阶接近度,SDNE采用了拉普拉斯特征映射的思想。
群落结构
M-NMF是一个用于图表征学习的模块化非负矩阵因子化模型,旨在同时保留微观结构(即节点的一阶接近度和二阶接近度)以及中观群落结构。它们首先采用NMF模型来保留微观结构,同时通过模块化来最大化检测群落结构。然后,他们引入了一个辅助的群落表征矩阵来连接节点的表征和群落结构。通过这种方式,学习到的节点表征将同时受到微观结构和群落结构的制约。
这篇关于图表征学习——Graph Embedding的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!