清华大学:序列推荐模型稳定性飙升,STDP框架惊艳登场

本文主要是介绍清华大学:序列推荐模型稳定性飙升,STDP框架惊艳登场,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

获取本文论文原文PDF,请公众号留言:论文解读

fc2d9b705d2eea77c8a568e15874709a.jpeg

引言:在线平台推荐系统的挑战与机遇

在线平台已成为我们日常生活中不可或缺的一部分,它们提供了丰富多样的商品和服务。然而,如何为用户推荐感兴趣的项目仍然是一个挑战。为了解决这个问题,研究者们提出了序列推荐任务,旨在从用户的历史行为序列中提炼出用户的兴趣,并据此进行恰当的推荐。尽管现有的方法在捕捉用户兴趣方面取得了一定的进展,但随机噪声的存在仍然是一个主要挑战。在现实世界的推荐平台中,随机噪声可能来源于用户从多个合适的候选项中随机选择一个项目,或者用户以随机顺序访问多个项目。这种随机噪声会导致序列无法为描述用户偏好提供稳定的监督信号,从而干扰模型的优化。

面对这一挑战,研究者们提出了多种方法来处理噪声问题,包括过滤掉不可靠的实例、建模反事实数据分布以及采用两阶段方法来校正序列。然而,这些方法往往依赖于定位噪声项/动作,可能会带来错误累积问题,而且随机项也包含了描述用户偏好的有价值信息。

本文提出了一个新的框架——统计驱动的预训练(STDP)框架,它利用统计信息和预训练范式来稳定推荐模型的优化。通过这种方法,模型的鲁棒性得到了增强,同时也促进了模型对用户长期偏好的捕捉。实验结果验证了我们提出的STDP框架的有效性,它改进了现有方法并取得了最先进的性能。

论文概览:标题、作者、出版信息和链接

标题: Beyond the Sequence: Statistics-Driven Pre-training for Stabilizing Sequential Recommendation Model

作者: Sirui Wang, Peiguang Li, Yunsen Xian, Hongzhi Zhang

出版信息: Seventeenth ACM Conference on Recommender Systems (RecSys ’23), September 18–22, 2023, Singapore, Singapore. ACM, New York, NY, USA

链接: https://arxiv.org/pdf/2404.05342.pdf

随机噪声对推荐系统的影响

1. 随机噪声的来源和问题

在现实世界的推荐平台中,随机噪声可能源自用户在多个合适候选项中随机选择一个项目,或者用户以随机顺序访问多个项目等情况。这种随机性导致序列不能提供稳定的监督信号来描述用户偏好,进而干扰了推荐模型的优化过程。

Sun等人首先验证了噪声行为的存在和严重性,并提出了一个过滤器来移除不可靠的实例。Zhang等人提出了对抗稀疏和噪声特性的行为序列的反事实数据分布模型。Lin等人提出了一种两阶段方法,首先通过调整噪声项目来纠正序列,然后用纠正后的序列训练模型。然而,现有方法依赖于定位噪声项/动作,并带来错误累积问题,而且随机项也包含描述用户偏好的有价值信息。

2. 现有方法的局限性

尽管现有方法在定位噪声项/动作方面取得了一定的进展,但它们存在依赖于错误累积的问题。此外,这些方法忽略了随机项中包含的描述用户偏好的有价值信息。因此,需要一种方法来减少随机噪声对模型优化的影响,并利用更稳定的信息来提高推荐系统的性能。

STDP框架介绍:统计信息驱动的预训练

1. 框架概述与基础模型

STDP(StatisTics-Driven Pre-training)框架利用统计信息和预训练范式来稳定推荐模型的优化。该框架采用SASRec作为基础模型,并设计了几个预训练任务:共现项目预测(CIP)、成对序列相似性(PSS)、频繁属性预测(FAP)和由Zhou等人提出的项目属性预测(IAP)。

基础模型SASRec主要由嵌入层、编码层和预测层组成。嵌入层将用户访问的项目序列映射为d维向量序列,并集成位置特征。编码层使用多个自注意力块进行序列编码,生成序列的表示。预测层计算用户在下一步访问项目的概率。

81a117cd46d605a8645cae92458de597.jpeg

2. 预训练任务的设计

STDP框架设计了以下预训练任务:

  • 共现项目预测(CIP):优化模型以预测下一个项目及其最常共现的项目,鼓励模型关注多个合适的目标,而不仅仅是可能不稳定的下一个项目。
  • 成对序列相似性(PSS):通过将原始序列中的部分项目随机替换为它们的共现项目来生成成对序列,然后最大化原始序列和成对序列表示之间的相似性,增强模型对随机噪声的鲁棒性。
  • 频繁属性预测(FAP):鼓励模型基于序列特征预测频繁属性,以促进捕获用户的长期偏好。

通过这些预训练任务,STDP框架提高了模型对随机访问输入的鲁棒性,并通过统计信息帮助模型捕获稳定的长期偏好。

统计信息的作用

在推荐系统中,统计信息的作用不可忽视。它为模型提供了稳定的信息,有助于减少随机噪声对模型优化的影响。本文中,我们特别关注了两种统计信息:项目共现信息和属性频率信息。

1. 项目共现信息的利用

项目共现信息是通过统计训练数据中项目的共现情况得到的。在本研究中,我们提出了两个预训练任务来利用这些信息。首先是共现项目预测(Co-occurred Items Prediction, CIP)任务,它鼓励模型预测下一个项目及其共现项目,从而使模型关注多个合适的目标,而不是仅仅集中在可能不稳定的下一个项目上。其次是配对序列相似性(Paired Sequence Similarity, PSS)任务,通过随机替换序列中的部分项目为它们的共现项目,并随机交换项目顺序,来模拟用户随机访问多个项目的情况。这样,模型在输入中模仿随机访问,从而增强了其鲁棒性。

2. 属性频率信息的应用

属性频率信息是通过统计序列中属性的出现频率得到的。在本文中,我们设计了一个序列级的频繁属性预测(Frequent Attribute Prediction, FAP)任务,鼓励模型基于序列特征预测频繁属性,从而帮助捕捉用户的长期偏好。这种方法的有效性得到了实验结果的验证,它改进了现有方法,实现了最先进的性能。

实验设置与评估方法

数据集和实验环境

1. 数据集和实验环境

实验选择了六个公共数据集,包括美团、亚马逊(包括美容、运动和玩具)、Yelp和LastFM平台的数据集。这些数据集的详细统计信息列在表1中。实验数据由S3-Rec发布,其中项目序列按时间顺序组织。在数据准备过程中,共现项目集、属性集和喜好集的大小都限制为20,PSS任务中的替换率设置为0.2。序列长度填充到50,每个小批量的大小填充到256。

59035dc09305268e0451d17b3792875e.jpeg

2. 评估指标和基线方法

为了与先前的方法进行公平比较,我们保留了每个序列中的最后一个和倒数第二个项目作为测试和验证,其余项目用于训练。我们采用命中率(Hit Ratio, HR@5和HR@10)、归一化折扣累积增益(Normalized Discounted Cumulative Gain, NDCG@5和NDCG@10)和平均倒数排名(Mean Reciprocal Rank, MRR)作为评估指标。值得注意的是,评估是基于采样的项目集进行的。

我们选择了以下几种竞争性的基线方法进行性能比较:SASRec利用多头自注意力机制从Transformer网络捕获长期语义;BERT4Rec采用双向自注意力机制,并使用Cloze目标损失进行预训练;FDSA将异构信息集成到项目序列中,并从多个角度预测下一个项目;S3-Rec预训练SASRec模型以捕获异构信息之间的相关性,从而改进序列推荐,实现了最先进的性能。

实验结果与分析

1. STDP框架的整体性能

在实验中,我们的STDP框架在六个数据集上的表现均优于现有的基线方法。通过对比实验,我们发现STDP框架在MRR指标上平均提升了17.66%,并且在所有数据集上都实现了最佳得分。这一结果表明,STDP框架能够有效地利用统计信息来减少随机噪声的负面影响,从而提高了模型的整体性能。

2. 消融研究:各个任务的贡献

为了进一步理解STDP框架中各个任务的贡献,我们进行了一系列的消融实验。结果显示,去除配对序列相似性(PSS)任务会比去除共现项目预测(CIP)任务对性能产生更大的影响。这可能是因为PSS任务直接作用于序列层面,而CIP任务则在项目层面发挥作用。此外,当同时去除CIP和PSS任务时,性能显著下降,这验证了全局共现信息在模型中的重要性。

3. 泛化能力验证

为了验证STDP框架的泛化能力,我们将其应用于GRU4Rec模型,并观察到性能有了显著提升。这一结果表明,STDP框架不仅适用于SASRec模型,也能够有效地提升其他序列推荐模型的性能,证明了其良好的泛化能力。

f29c25cbd5f635259bebdb16b32332f2.jpeg

f483b99a060c8ba8c8ff038c96357d60.jpeg

结论与未来展望

1. STDP框架的优势总结

本文提出的STDP框架通过利用统计信息和预训练任务来减少随机噪声的影响,显著提高了序列推荐模型的稳定性和性能。实验结果表明,STDP框架在多个数据集上均取得了最佳性能,证明了其有效性。

2. 对其他模型的推广潜力

STDP框架的设计不依赖于特定的序列推荐模型,因此具有很好的推广潜力。实验中将STDP应用于GRU4Rec模型也取得了积极的结果,这进一步验证了STDP框架的通用性和适用性。

3. 后续研究方向

尽管STDP框架已经显示出强大的性能,但仍有进一步的研究空间。未来的研究可以探索更多类型的统计信息,以及如何更有效地整合这些信息以进一步提升模型的鲁棒性和准确性。此外,可以考虑将STDP框架应用于更广泛的序列建模任务中,以验证其在不同领域的有效性。

这篇关于清华大学:序列推荐模型稳定性飙升,STDP框架惊艳登场的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/927444

相关文章

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

大语言模型(LLMs)能够进行推理和规划吗?

大语言模型(LLMs),基本上是经过强化训练的 n-gram 模型,它们在网络规模的语言语料库(实际上,可以说是我们文明的知识库)上进行了训练,展现出了一种超乎预期的语言行为,引发了我们的广泛关注。从训练和操作的角度来看,LLMs 可以被认为是一种巨大的、非真实的记忆库,相当于为我们所有人提供了一个外部的系统 1(见图 1)。然而,它们表面上的多功能性让许多研究者好奇,这些模型是否也能在通常需要系

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测 目录 时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测基本介绍程序设计参考资料 基本介绍 MATLAB实现LSTM时间序列未来多步预测-递归预测。LSTM是一种含有LSTM区块(blocks)或其他的一种类神经网络,文献或其他资料中LSTM区块可能被描述成智能网络单元,因为

Linux系统稳定性的奥秘:探究其背后的机制与哲学

在计算机操作系统的世界里,Linux以其卓越的稳定性和可靠性著称,成为服务器、嵌入式系统乃至个人电脑用户的首选。那么,是什么造就了Linux如此之高的稳定性呢?本文将深入解析Linux系统稳定性的几个关键因素,揭示其背后的技术哲学与实践。 1. 开源协作的力量Linux是一个开源项目,意味着任何人都可以查看、修改和贡献其源代码。这种开放性吸引了全球成千上万的开发者参与到内核的维护与优化中,形成了

人工和AI大语言模型成本对比 ai语音模型

这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。 但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。让“今天天气很好”的概率高于“今天天汽很好”的概率,得到声学模型概率高,又符合表达

智能客服到个人助理,国内AI大模型如何改变我们的生活?

引言 随着人工智能(AI)技术的高速发展,AI大模型越来越多地出现在我们的日常生活和工作中。国内的AI大模型在过去几年里取得了显著的进展,不少独创的技术点和实际应用令人瞩目。 那么,国内的AI大模型有哪些独创的技术点?它们在实际应用中又有哪些出色表现呢?此外,普通人又该如何利用这些大模型提升工作和生活的质量和效率呢?本文将为你一一解析。 一、国内AI大模型的独创技术点 多模态学习 多

OpenCompass:大模型测评工具

大模型相关目录 大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容 从0起步,扬帆起航。 大模型应用向开发路径:AI代理工作流大模型应用开发实用开源项目汇总大模型问答项目问答性能评估方法大模型数据侧总结大模型token等基本概念及参数和内存的关系大模型应用开发-华为大模型生态规划从零开始的LLaMA-Factor

模型压缩综述

https://www.cnblogs.com/shixiangwan/p/9015010.html

蓝牙ble数传芯片推荐,TD5327A芯片蓝牙5.1—拓达半导体

蓝牙数传芯片TD5327A芯片是一款支持蓝牙BLE的纯数传芯片,蓝牙5.1版本。芯片的亮点在于性能强,除了支持APP端直接对芯片做设置与查询操作,包括直接操作蓝牙芯片自身的IO与PWM口以外,还支持RTC日历功能,可以做各类定时类操作,极大丰富了蓝牙在IOT产品中的应用。此外,在数传应用方面,此芯片支持串口流控功能,提大提高了数据传输的稳定与可靠性。 拓达蓝牙芯片特点: 支持RTC日历功能,超

AI赋能天气:微软研究院发布首个大规模大气基础模型Aurora

编者按:气候变化日益加剧,高温、洪水、干旱,频率和强度不断增加的全球极端天气给整个人类社会都带来了难以估计的影响。这给现有的天气预测模型提出了更高的要求——这些模型要更准确地预测极端天气变化,为政府、企业和公众提供更可靠的信息,以便做出及时的准备和响应。为了应对这一挑战,微软研究院开发了首个大规模大气基础模型 Aurora,其超高的预测准确率、效率及计算速度,实现了目前最先进天气预测系统性能的显著