论文笔记:ATime-Aware Trajectory Embedding Model for Next-Location Recommendation

本文主要是介绍论文笔记:ATime-Aware Trajectory Embedding Model for Next-Location Recommendation,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Knowledge and Information Systems, 2018

1 intro

1.1 背景

  • 随着基于位置的社交网络(LBSNs),如Foursquare和Facebook Places的日益流行,大量用户签到数据变得可用
    • 这些大量签到数据的可用性带来了许多有用的应用,以提升基于位置服务的用户体验
    • 其中一个任务是新兴的下一个位置推荐
  • 下一个位置推荐根据用户过去的签到记录,预测可能访问的后续位置
    • 时间信息在这个任务中扮演了重要角色
      • 例如,如果访问时间是工作日的早晨,用户从“家”开始访问“地铁”,然后“办公室”(或工作地点)应该是对这位用户的合适推荐
      • 如果访问时间是周末,则应推荐放松的地点

1.2 现有的工作

  • 现有的下一个位置推荐研究主要基于马尔可夫链属性模型连续签到之间的序列转换模式。
    • 由于数据稀疏性和计算复杂性,序列转换限制于一阶转换,无法捕捉更长的序列上下文。
    • 更重要的是,推荐任务中缺乏对多种时间因素的全面和深入考虑。
  • 在现有研究中,用户偏好通常被视为静态的,这并不反映用户兴趣的演变特征
    • 例如,学生可能在学期期间更频繁地在大学签到,而在作为某公司夏季实习生时则更频繁地在工作场所签到
      • ——>她的签到行为在不同时间段内发生变化
  • 现有研究也忽略了周期性模式
    • 例如,在工作日,用户可能早上在办公室签到,晚上在家签到

1.3 下一位置推荐的挑战性

  • 首先,如上例所示,用户的签到行为会随时间改变
  • 其次,即使我们能够根据用户推导出访问模式(例如,周末“家”→“商店”→“午餐”→“商店”→“晚餐”),仍然很难推断出每个模式的确切位置
    • 因为多个候选位置可能适合
      • 晚餐的下一个位置应基于多种考虑生成,包括自己的偏好、之前访问过的地点和其他时间因素

1.4 论文思路

  • 提出了一个新颖的时间感知轨迹嵌入模型(TA-TEM)

2 轨迹观察

  • 如之前的论文所言,序列影响是轨迹数据中最重要的时间因素之一,即用户连续签到点之间存在马尔可夫链特性。
  • 论文研究实际轨迹数据上的另外两种时间因素。

2.1 数据集

  • 三个公共地理社交网络数据集,每个数据集包含一年的签到数据

仅报告Gowalla数据集的结果,其他两个数据集的观察结果类似

2.2  观察1:用户对签到的偏好会随着长时间周期(例如,一个月)的变化而变化

  • 直观地说,用户的兴趣可能会在一段时间后发生变化(例如,一个月),这可能导致不同时间段的访问行为不同
  • 给定一个用户u,论文通过计算两个连续时间周期中u访问的位置集合的Jaccard相似度的平均值来计算重叠比率值(ORV)。
    • 设置一个时间周期为一个月
      • 在上述等式中,L(u,i)是用户u在第i个月访问的位置集合
      • 选择签到记录最多的前1000名用户,然后计算这些用户的平均ORV
  • 平均ORV是0.035(±0.002)
  • ——>小的Jaccard相似性值表明,在连续两个月中用户的签到位置之间的重叠很少。
    • 换句话说,用户对签到行为的偏好在长时间周期内会发生变化

2.3 观察2:周期性签到模式显著

  • 直观地说,用户可能有一些规律的日常和周常活动,如中午吃饭和周末放松。
    • 因此,位置的生成很可能会受到相应时间信息的影响,如一天中的小时和一周中的天
  • 周常模式:
    • 将轨迹分成按天的多个间隔,然后将所有用户在第i个间隔访问的位置组合成一个位置集合L(i)【一个簇】
      • 计算这七个簇中两个位置集合的平均内部和外部相似性
      • 内部和外部表示位置集合来自同一个和不同的簇
      • 使用Jaccard系数来测量两个位置集合之间的相似性

  • 对角线条目的Jaccard系数显著高于非对角线条目
    • ——>在一周内同一时间索引生成的两个位置集合比不同时间索引的更相似 
  • 基于小时索引进行类似的分析,结果绘制在图2(b)中,发现用户轨迹显示出有趣的时间模式

3 方法

3.1 轨迹嵌入:基本模型

  • 类似于word2vec
  • 位置j,窗口大小2K的上下文嵌入:
  • 轨迹t的目标函数

3.2 整合用户偏好变化

  • 用户在签到时的偏好可能随时间变化(见观察1)
  • 为了建模这一因素,论文将签到分为若干个月份,并假设用户u在第m个月与一个独特的人格vum​相关联。
    • 这里使用“人格”一词是为了反映用户随时间变化的偏好。
    • 除了偏好变化外,还假设用户对位置有一个相对稳定的总体偏好,这有助于生成常去的地点,如工作场所和家

3.3 整合周期性模式

  • 周期性签到模式描绘了观察2中提到的每周和每日的移动模式
  • 当用户生成轨迹时,他的行为不仅受到自己的偏好影响,还受到周期性偏好的影响。
  • 设hj和dt分别为轨迹t中第j个位置的一天中的小时索引和一周中的天索引。形式上,我们有:

3.4 TA-TEM 模型

目标函数更新为:

位置lj的上下文嵌入为:

3.5 推荐位置排名

一旦所有嵌入向量都学习完成,我们按以下方式生成下一个位置推荐

  • 给定用户u的前K个签到1,2,…,K1和下一个时间戳sK+1​(对应于月份m、天d和小时h),使用以下函数来排名候选位置L:

4 实验

这篇关于论文笔记:ATime-Aware Trajectory Embedding Model for Next-Location Recommendation的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1059237

相关文章

GORM中Model和Table的区别及使用

《GORM中Model和Table的区别及使用》Model和Table是两种与数据库表交互的核心方法,但它们的用途和行为存在著差异,本文主要介绍了GORM中Model和Table的区别及使用,具有一... 目录1. Model 的作用与特点1.1 核心用途1.2 行为特点1.3 示例China编程代码2. Tab

Nginx配置location+rewrite实现隐性域名配置

《Nginx配置location+rewrite实现隐性域名配置》本文主要介绍了Nginx配置location+rewrite实现隐性域名配置,包括基于根目录、条件和反向代理+rewrite配置的隐性... 目录1、配置基于根目录的隐性域名(就是nginx反向代理)2、配置基于条件的隐性域名2.1、基于条件

MySQL中Next-Key Lock底层原理实现

《MySQL中Next-KeyLock底层原理实现》Next-KeyLock是MySQLInnoDB存储引擎中的一种锁机制,结合记录锁和间隙锁,用于高效并发控制并避免幻读,本文主要介绍了MySQL中... 目录一、Next-Key Lock 的定义与作用二、底层原理三、源代码解析四、总结Next-Key L

Nginx中location实现多条件匹配的方法详解

《Nginx中location实现多条件匹配的方法详解》在Nginx中,location指令用于匹配请求的URI,虽然location本身是基于单一匹配规则的,但可以通过多种方式实现多个条件的匹配逻辑... 目录1. 概述2. 实现多条件匹配的方式2.1 使用多个 location 块2.2 使用正则表达式

你的华为手机升级了吗? 鸿蒙NEXT多连推5.0.123版本变化颇多

《你的华为手机升级了吗?鸿蒙NEXT多连推5.0.123版本变化颇多》现在的手机系统更新可不仅仅是修修补补那么简单了,华为手机的鸿蒙系统最近可是动作频频,给用户们带来了不少惊喜... 为了让用户的使用体验变得很好,华为手机不仅发布了一系列给力的新机,还在操作系统方面进行了疯狂的发力。尤其是近期,不仅鸿蒙O

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快