推荐系统模型的实时性

2024-06-04 12:18
文章标签 系统 推荐 模型 实时性

本文主要是介绍推荐系统模型的实时性,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

模型的实时性与模型的训练方式紧密相关,模型的实时性由弱到强的训练方式分别是全量更新,增量更新和在线学习。
1.全量更新
模型在某个时间段内所有训练样本进行训练,全量更新是最常用的训练方式
2.增量更新
增量更新仅将新加入的样本“喂”给模型进行增量训练,从技术上讲,深度学习模型往往采用随机梯度下降SGD法及其变种进行学习,缺点是增量更新的模型往往无法找到全局最优点,因此在实际的推荐系统中,经常采用增量更新与全局更新结合的方式,在进行了几轮增量更新后,在业务量较小的时间窗口进行全局更新。
3.在线学习
是进行模型实时更新的主要方法,也就是在获得一个新的样本的同时更新模型,与增量更新一样,在技术上也是使用SGD训练方式实现,但由于需要在线上环境进行模型的训练和大量模型相关参数的更新和存储,工程上的要求比较高。在线学习另一个附带问题是模型的稀疏性不强,例如一个输入特征量达到几百W维的模型中,如果模型的稀疏性好,就可以在模型效果不受影响的前提下,仅让极小一部分的特征权重非0,从而让上线的模型体积很小(摒弃掉所有权重为0的特征),在这方面,兼顾训练效果和模型稀疏性,有大量相关研究,包括微软的FOBOS,谷歌的FTRL等。
在线学习的另一个方向是将强化学习与推荐系统结合,在DRN模型中,应用竞争梯度下降算法等。
4.局部更新
进行模型的局部更新,降低训练效率低的部分的更新频率,提高训练效率高的部分的更新频率,例如Facebook的GBDT+LR模型,GBDT训练效率低,更新周期长,这样Facebook采取每天训练一次GBDT,固定GBDT模型后,实时训练LR模型。模型局部更新的做法较多应用在“Embedding+神经网络”模型中,业界往往采用Embedding层单独预训练和EMbedding层以上的模型部分高频更新的混合策略。
5.客户端模型实时更新
能否在客户端就根据当前用户的行为历史更新模型呢?在推荐系统业界仍处于探索阶段,对于一些计算机视觉的模型,可以通过模型压缩的方式生成轻量级模型,部署于客户端,但对于推荐模型这类重量级模型,需要依赖服务端强大计算资源和丰富的特征数据进行模型服务。但客户端往往可以保存和更新模型一部分的参数和特征,比如当前用户的Embedding向量。这里的逻辑和动机是,模型往往要接受用户Embedding和物品Embedding两个关键的特征向量。对于物品Embedding的更新,一般需要全局的数据,因此只能在服务端进行更新,而对于用户Embedding,更多依赖用户自身的数据,这部分放在客户端,能实时把用户最近的行为数据反应的用的Embedding。例如用户Embedding是由用户点击过的物品Embedding进行平均得到,那么最先得到用户最新点击物品信息的客户端,就可以根据用户点击物品的Embedding实时更新用户Embedding,并保存在该Embedding,在下次推荐时,将更新后的用户Embedding传给服务器,服务器端可根据最新的用户Embedding返回实时推荐内容。

参考《深度学习推荐系统》

这篇关于推荐系统模型的实时性的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1030060

相关文章

JWT + 拦截器实现无状态登录系统

《JWT+拦截器实现无状态登录系统》JWT(JSONWebToken)提供了一种无状态的解决方案:用户登录后,服务器返回一个Token,后续请求携带该Token即可完成身份验证,无需服务器存储会话... 目录✅ 引言 一、JWT 是什么? 二、技术选型 三、项目结构 四、核心代码实现4.1 添加依赖(pom

基于Python实现自动化邮件发送系统的完整指南

《基于Python实现自动化邮件发送系统的完整指南》在现代软件开发和自动化流程中,邮件通知是一个常见且实用的功能,无论是用于发送报告、告警信息还是用户提醒,通过Python实现自动化的邮件发送功能都能... 目录一、前言:二、项目概述三、配置文件 `.env` 解析四、代码结构解析1. 导入模块2. 加载环

linux系统上安装JDK8全过程

《linux系统上安装JDK8全过程》文章介绍安装JDK的必要性及Linux下JDK8的安装步骤,包括卸载旧版本、下载解压、配置环境变量等,强调开发需JDK,运行可选JRE,现JDK已集成JRE... 目录为什么要安装jdk?1.查看linux系统是否有自带的jdk:2.下载jdk压缩包2.解压3.配置环境

Linux查询服务器系统版本号的多种方法

《Linux查询服务器系统版本号的多种方法》在Linux系统管理和维护工作中,了解当前操作系统的版本信息是最基础也是最重要的操作之一,系统版本不仅关系到软件兼容性、安全更新策略,还直接影响到故障排查和... 目录一、引言:系统版本查询的重要性二、基础命令解析:cat /etc/Centos-release详

更改linux系统的默认Python版本方式

《更改linux系统的默认Python版本方式》通过删除原Python软链接并创建指向python3.6的新链接,可切换系统默认Python版本,需注意版本冲突、环境混乱及维护问题,建议使用pyenv... 目录更改系统的默认python版本软链接软链接的特点创建软链接的命令使用场景注意事项总结更改系统的默

在Linux系统上连接GitHub的方法步骤(适用2025年)

《在Linux系统上连接GitHub的方法步骤(适用2025年)》在2025年,使用Linux系统连接GitHub的推荐方式是通过SSH(SecureShell)协议进行身份验证,这种方式不仅安全,还... 目录步骤一:检查并安装 Git步骤二:生成 SSH 密钥步骤三:将 SSH 公钥添加到 github

Linux系统中查询JDK安装目录的几种常用方法

《Linux系统中查询JDK安装目录的几种常用方法》:本文主要介绍Linux系统中查询JDK安装目录的几种常用方法,方法分别是通过update-alternatives、Java命令、环境变量及目... 目录方法 1:通过update-alternatives查询(推荐)方法 2:检查所有已安装的 JDK方

Linux系统之lvcreate命令使用解读

《Linux系统之lvcreate命令使用解读》lvcreate是LVM中创建逻辑卷的核心命令,支持线性、条带化、RAID、镜像、快照、瘦池和缓存池等多种类型,实现灵活存储资源管理,需注意空间分配、R... 目录lvcreate命令详解一、命令概述二、语法格式三、核心功能四、选项详解五、使用示例1. 创建逻

使用Python构建一个高效的日志处理系统

《使用Python构建一个高效的日志处理系统》这篇文章主要为大家详细讲解了如何使用Python开发一个专业的日志分析工具,能够自动化处理、分析和可视化各类日志文件,大幅提升运维效率,需要的可以了解下... 目录环境准备工具功能概述完整代码实现代码深度解析1. 类设计与初始化2. 日志解析核心逻辑3. 文件处

golang程序打包成脚本部署到Linux系统方式

《golang程序打包成脚本部署到Linux系统方式》Golang程序通过本地编译(设置GOOS为linux生成无后缀二进制文件),上传至Linux服务器后赋权执行,使用nohup命令实现后台运行,完... 目录本地编译golang程序上传Golang二进制文件到linux服务器总结本地编译Golang程序