推荐系统模型的实时性

2024-06-04 12:18
文章标签 系统 推荐 模型 实时性

本文主要是介绍推荐系统模型的实时性,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

模型的实时性与模型的训练方式紧密相关,模型的实时性由弱到强的训练方式分别是全量更新,增量更新和在线学习。
1.全量更新
模型在某个时间段内所有训练样本进行训练,全量更新是最常用的训练方式
2.增量更新
增量更新仅将新加入的样本“喂”给模型进行增量训练,从技术上讲,深度学习模型往往采用随机梯度下降SGD法及其变种进行学习,缺点是增量更新的模型往往无法找到全局最优点,因此在实际的推荐系统中,经常采用增量更新与全局更新结合的方式,在进行了几轮增量更新后,在业务量较小的时间窗口进行全局更新。
3.在线学习
是进行模型实时更新的主要方法,也就是在获得一个新的样本的同时更新模型,与增量更新一样,在技术上也是使用SGD训练方式实现,但由于需要在线上环境进行模型的训练和大量模型相关参数的更新和存储,工程上的要求比较高。在线学习另一个附带问题是模型的稀疏性不强,例如一个输入特征量达到几百W维的模型中,如果模型的稀疏性好,就可以在模型效果不受影响的前提下,仅让极小一部分的特征权重非0,从而让上线的模型体积很小(摒弃掉所有权重为0的特征),在这方面,兼顾训练效果和模型稀疏性,有大量相关研究,包括微软的FOBOS,谷歌的FTRL等。
在线学习的另一个方向是将强化学习与推荐系统结合,在DRN模型中,应用竞争梯度下降算法等。
4.局部更新
进行模型的局部更新,降低训练效率低的部分的更新频率,提高训练效率高的部分的更新频率,例如Facebook的GBDT+LR模型,GBDT训练效率低,更新周期长,这样Facebook采取每天训练一次GBDT,固定GBDT模型后,实时训练LR模型。模型局部更新的做法较多应用在“Embedding+神经网络”模型中,业界往往采用Embedding层单独预训练和EMbedding层以上的模型部分高频更新的混合策略。
5.客户端模型实时更新
能否在客户端就根据当前用户的行为历史更新模型呢?在推荐系统业界仍处于探索阶段,对于一些计算机视觉的模型,可以通过模型压缩的方式生成轻量级模型,部署于客户端,但对于推荐模型这类重量级模型,需要依赖服务端强大计算资源和丰富的特征数据进行模型服务。但客户端往往可以保存和更新模型一部分的参数和特征,比如当前用户的Embedding向量。这里的逻辑和动机是,模型往往要接受用户Embedding和物品Embedding两个关键的特征向量。对于物品Embedding的更新,一般需要全局的数据,因此只能在服务端进行更新,而对于用户Embedding,更多依赖用户自身的数据,这部分放在客户端,能实时把用户最近的行为数据反应的用的Embedding。例如用户Embedding是由用户点击过的物品Embedding进行平均得到,那么最先得到用户最新点击物品信息的客户端,就可以根据用户点击物品的Embedding实时更新用户Embedding,并保存在该Embedding,在下次推荐时,将更新后的用户Embedding传给服务器,服务器端可根据最新的用户Embedding返回实时推荐内容。

参考《深度学习推荐系统》

这篇关于推荐系统模型的实时性的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1030060

相关文章

Python将大量遥感数据的值缩放指定倍数的方法(推荐)

《Python将大量遥感数据的值缩放指定倍数的方法(推荐)》本文介绍基于Python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处理,并将所得处理后数据保存为新的遥感影像... 本文介绍基于python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处

在C#中获取端口号与系统信息的高效实践

《在C#中获取端口号与系统信息的高效实践》在现代软件开发中,尤其是系统管理、运维、监控和性能优化等场景中,了解计算机硬件和网络的状态至关重要,C#作为一种广泛应用的编程语言,提供了丰富的API来帮助开... 目录引言1. 获取端口号信息1.1 获取活动的 TCP 和 UDP 连接说明:应用场景:2. 获取硬

JAVA系统中Spring Boot应用程序的配置文件application.yml使用详解

《JAVA系统中SpringBoot应用程序的配置文件application.yml使用详解》:本文主要介绍JAVA系统中SpringBoot应用程序的配置文件application.yml的... 目录文件路径文件内容解释1. Server 配置2. Spring 配置3. Logging 配置4. Ma

Golang的CSP模型简介(最新推荐)

《Golang的CSP模型简介(最新推荐)》Golang采用了CSP(CommunicatingSequentialProcesses,通信顺序进程)并发模型,通过goroutine和channe... 目录前言一、介绍1. 什么是 CSP 模型2. Goroutine3. Channel4. Channe

2.1/5.1和7.1声道系统有什么区别? 音频声道的专业知识科普

《2.1/5.1和7.1声道系统有什么区别?音频声道的专业知识科普》当设置环绕声系统时,会遇到2.1、5.1、7.1、7.1.2、9.1等数字,当一遍又一遍地看到它们时,可能想知道它们是什... 想要把智能电视自带的音响升级成专业级的家庭影院系统吗?那么你将面临一个重要的选择——使用 2.1、5.1 还是

高效管理你的Linux系统: Debian操作系统常用命令指南

《高效管理你的Linux系统:Debian操作系统常用命令指南》在Debian操作系统中,了解和掌握常用命令对于提高工作效率和系统管理至关重要,本文将详细介绍Debian的常用命令,帮助读者更好地使... Debian是一个流行的linux发行版,它以其稳定性、强大的软件包管理和丰富的社区资源而闻名。在使用

Ubuntu系统怎么安装Warp? 新一代AI 终端神器安装使用方法

《Ubuntu系统怎么安装Warp?新一代AI终端神器安装使用方法》Warp是一款使用Rust开发的现代化AI终端工具,该怎么再Ubuntu系统中安装使用呢?下面我们就来看看详细教程... Warp Terminal 是一款使用 Rust 开发的现代化「AI 终端」工具。最初它只支持 MACOS,但在 20

windows系统下shutdown重启关机命令超详细教程

《windows系统下shutdown重启关机命令超详细教程》shutdown命令是一个强大的工具,允许你通过命令行快速完成关机、重启或注销操作,本文将为你详细解析shutdown命令的使用方法,并提... 目录一、shutdown 命令简介二、shutdown 命令的基本用法三、远程关机与重启四、实际应用

Debian如何查看系统版本? 7种轻松查看Debian版本信息的实用方法

《Debian如何查看系统版本?7种轻松查看Debian版本信息的实用方法》Debian是一个广泛使用的Linux发行版,用户有时需要查看其版本信息以进行系统管理、故障排除或兼容性检查,在Debia... 作为最受欢迎的 linux 发行版之一,Debian 的版本信息在日常使用和系统维护中起着至关重要的作

什么是cron? Linux系统下Cron定时任务使用指南

《什么是cron?Linux系统下Cron定时任务使用指南》在日常的Linux系统管理和维护中,定时执行任务是非常常见的需求,你可能需要每天执行备份任务、清理系统日志或运行特定的脚本,而不想每天... 在管理 linux 服务器的过程中,总有一些任务需要我们定期或重复执行。就比如备份任务,通常会选在服务器资