【GCN】: Graph Convolutional Neural Networks for Web-Scale Recommender Systems

本文主要是介绍【GCN】: Graph Convolutional Neural Networks for Web-Scale Recommender Systems,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最近看了“Graph Convolutional Neural Networks for Web-Scale Recommender Systems”这篇文章,是Pinterest将GCN成功应用在大规模真实场景的论文,唯一可惜的是没有公开源码。

论文下载地址:https://arxiv.org/pdf/1806.01973

论文包含了理论创新和实际落地实现中的一些工程优化。这里对算法理论这块做一下简单记录。

这篇文章虽然说是GCN算法,但是全文看下来其实和卷积并没有很大的关系。GCN算法大多数都是端到端的计算,需要在整个graph上训练。这样的话很难将算法扩展应用到实际的大规模工业应用上。

所以文章提出了一个局部卷积的概念,不在全局的graph上优化算法,而是给特定的节点形成一个包含有限领域节点的子图,在子图上构造局部卷积,然后不同节点共享同样的局部卷积参数,也许正是因为要共享参数,所以作者把这个叫做卷积吧。

局部卷积

整个算法中,局部卷积算法'CONVOLVE'应该是最核心的部分。

                            

这个CONVOLVE是逐点优化的算法,所以输入是当前计算的节点u的embedding,以及它所对应的领域节点的embedding。而具体的卷积操作其实就是一些全联接构造成的映射。

分析一下上图的后面三行伪代码。

第一行里面的h_v指的是领域节点v的embedding,这里感觉作者没写清楚,我刚开始也没看明白,后来看了图才看明白。

                                      

一个CONVOLVE模块(流程图中的那三行伪代码)就是如下图这样的一个模块:

                                                

先是对节点的领域节点经过Q映射后,再利用weight-pooling函数\gamma让输出的维度和输入保持一致,生成所有领域节点统一的embedding向量h_{N(A)}

第二行的伪代码描述的是节点embedding的更新,直接把上一层或者初始的embedding和领域节点embedding一起concate起来,再加上一层全联接就可以生成新的节点embedding。第三行的代码只是对输出的节点embedding做了L2归一化,让训练更稳定。

这一个CONVOLVE里的参数,比如Q,q,W,w这些都是共享的,每个节点都一样。

怎么用

现在最核心的算法模块有了,需要先构造输入,输入是按节点迭代,那么每次输入CONVOLVE的就是当前节点,和选择出来的领域。那么领域怎么选?

Importance-based neighborhoods.

作者为了统一每个节点的领域个数,已经进一步引入每个领域节点对当前节点的重要性,采用了随机游走的策略来生成节点的领域。并且通过计算随机游走对顶点的访问次数的 ?1 归一化值。来定义领域节点的重要性,按对定点的访问次数排序后取top-T个节点作为当前节点的领域。

在分析代码流程图的时候,里面的weight-pooling函数的weight方式并没有提到,其实就是这里这里随机游走产生的这个L1归一化值。

其实到这里这个算法也勉强能用了,不过作者为了让这个算法更像卷积,进一步将CONVOLVE模块进行了stack。

Stacking convolutions.

思路比较简单,就是把CONVOLVE输出的embedding,再传入一个CONVOLVE,类似多层全联接一样,连起来。代码写起来可能会比较麻烦了,因为不同节点的领域不一样,那么堆叠到第二层的时候,输入CONVOLVE的节点就是上一层CONVOLVE的minibatch的节点的领域的领域。有点拗口。具体流程图如下:

                                 

具体分两部分。

第一部分,首先把每一层里节点的领域都计算好。(流程图里smpling neighborhoods of minibatch nodes下的代码)

第二部分就是循环计算每一层的CONVOLVE,把上一层CONVOLVE的输出作为下一层CONVOLVE的输入。

算法的最后是把最后一层CONVOLVE的输出再经过G1和G2做全联接映射后输出最终的节点embedding。

这里需要注意的是,前面我说过一个CONVOLVE的参数都是共享,这里的共享指的是同一层的CONVOLVE。对应不同层之间的CONVOLVE不共享参数。

能发现,这整个网络结构确实很像一个多层卷积网络,输入是节点和节点领域embedding,输出是新的节点embedding。

这个针对不同任务已经完全能够迁移作为backbone。

Loss function.

graph embedding和GNN的区别其中的一点是一个是无监督的,一个是有监督。

作者定义的损失函数是hinge loss:

                      

像这种loss,以及双通道结构的网络结构在工业界好像很受欢迎。

文章后面还写了一些实际实现工程中的加速优化,这里就不说了。大家可以直接去看原文,或者这里看这哥们翻译的文章。

这篇关于【GCN】: Graph Convolutional Neural Networks for Web-Scale Recommender Systems的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/768061

相关文章

手把手教你idea中创建一个javaweb(webapp)项目详细图文教程

《手把手教你idea中创建一个javaweb(webapp)项目详细图文教程》:本文主要介绍如何使用IntelliJIDEA创建一个Maven项目,并配置Tomcat服务器进行运行,过程包括创建... 1.启动idea2.创建项目模板点击项目-新建项目-选择maven,显示如下页面输入项目名称,选择

Java Web指的是什么

Java Web指的是使用Java技术进行Web开发的一种方式。Java在Web开发领域有着广泛的应用,主要通过Java EE(Enterprise Edition)平台来实现。  主要特点和技术包括: 1. Servlets和JSP:     Servlets 是Java编写的服务器端程序,用于处理客户端请求和生成动态网页内容。     JSP(JavaServer Pages)

BUUCTF靶场[web][极客大挑战 2019]Http、[HCTF 2018]admin

目录   [web][极客大挑战 2019]Http 考点:Referer协议、UA协议、X-Forwarded-For协议 [web][HCTF 2018]admin 考点:弱密码字典爆破 四种方法:   [web][极客大挑战 2019]Http 考点:Referer协议、UA协议、X-Forwarded-For协议 访问环境 老规矩,我们先查看源代码

EasyPlayer.js网页H5 Web js播放器能力合集

最近遇到一个需求,要求做一款播放器,发现能力上跟EasyPlayer.js基本一致,满足要求: 需求 功性能 分类 需求描述 功能 预览 分屏模式 单分屏(单屏/全屏) 多分屏(2*2) 多分屏(3*3) 多分屏(4*4) 播放控制 播放(单个或全部) 暂停(暂停时展示最后一帧画面) 停止(单个或全部) 声音控制(开关/音量调节) 主辅码流切换 辅助功能 屏

9.8javaweb项目总结

1.主界面用户信息显示 登录成功后,将用户信息存储在记录在 localStorage中,然后进入界面之前通过js来渲染主界面 存储用户信息 将用户信息渲染在主界面上,并且头像设置跳转,到个人资料界面 这里数据库中还没有设置相关信息 2.模糊查找 检测输入框是否有变更,有的话调用方法,进行查找 发送检测请求,然后接收的时候设置最多显示四个类似的搜索结果

JavaWeb【day09】--(Mybatis)

1. Mybatis基础操作 学习完mybatis入门后,我们继续学习mybatis基础操作。 1.1 需求 需求说明: 根据资料中提供的《tlias智能学习辅助系统》页面原型及需求,完成员工管理的需求开发。 通过分析以上的页面原型和需求,我们确定了功能列表: 查询 根据主键ID查询 条件查询 新增 更新 删除 根据主键ID删除 根据主键ID批量删除

利用Django框架快速构建Web应用:从零到上线

随着互联网的发展,Web应用的需求日益增长,而Django作为一个高级的Python Web框架,以其强大的功能和灵活的架构,成为了众多开发者的选择。本文将指导你如何从零开始使用Django框架构建一个简单的Web应用,并将其部署到线上,让世界看到你的作品。 Django简介 Django是由Adrian Holovaty和Simon Willison于2005年开发的一个开源框架,旨在简

web群集--nginx配置文件location匹配符的优先级顺序详解及验证

文章目录 前言优先级顺序优先级顺序(详解)1. 精确匹配(Exact Match)2. 正则表达式匹配(Regex Match)3. 前缀匹配(Prefix Match) 匹配规则的综合应用验证优先级 前言 location的作用 在 NGINX 中,location 指令用于定义如何处理特定的请求 URI。由于网站往往需要不同的处理方式来适应各种请求,NGINX 提供了多种匹

[论文笔记]LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale

引言 今天带来第一篇量化论文LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale笔记。 为了简单,下文中以翻译的口吻记录,比如替换"作者"为"我们"。 大语言模型已被广泛采用,但推理时需要大量的GPU内存。我们开发了一种Int8矩阵乘法的过程,用于Transformer中的前馈和注意力投影层,这可以将推理所需

构建高性能WEB之HTTP首部优化

0x00 前言 在讨论浏览器优化之前,首先我们先分析下从客户端发起一个HTTP请求到用户接收到响应之间,都发生了什么?知己知彼,才能百战不殆。这也是作为一个WEB开发者,为什么一定要深入学习TCP/IP等网络知识。 0x01 到底发生什么了? 当用户发起一个HTTP请求时,首先客户端将与服务端之间建立TCP连接,成功建立连接后,服务端将对请求进行处理,并对客户端做出响应,响应内容一般包括响应