POI推荐实战1:将NYC及CDRs处理后在GETNext运行

2024-03-13 10:40

本文主要是介绍POI推荐实战1:将NYC及CDRs处理后在GETNext运行,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

NYCTKYCDRsInGETNext

将数据经过deepmove方式处理后导入GETNext

目录

  • NYCTKYCDRsInGETNext
  • 1 NYC&TKY
    • 数据经DeepMove方式处理
    • 处理后pk文件经PG2Net导出并处理格式
    • 数据导入GETNext模型并在服务器训练
  • 2 CDRs
    • 数据经DeepMove方式处理
    • 处理后pk文件经PG2Net导出并处理格式
    • 数据导入GETNext模型并训练

1 NYC&TKY

数据经DeepMove方式处理

1、数据直接从Google下载原始txt文件
在这里插入图片描述
2、GETNext所给示例数据显示特征有如下这些:user_id,POI_id,POI_catid,POI_catid_code,POI_catname,latitude,longitude,timezone,UTC_time,local_time,day_of_week,norm_in_day_time,trajectory_id,norm_day_shift,norm_relative_time,但观察数据导入过程发现只需要norm_in_day_time,latitude,longitude,POI_catname,POI_catid_code,POI_catid,POI_id,user_id七项特征输入。于是确定经过数据处理后需要保留的特征
3、txt转csv并将时间调整为deepmove示例文件格式
在这里插入图片描述
4、deepmove数据处理函数调整
此函数用来生成sessions,与原来的session_tran对比,新建session_tran_new用来读取不同的所需要的特征如经纬度和用户id
在这里插入图片描述
5、在时间部分,与deepmove相比,GETNext不区分周六日并将一天按每半个小时划分。调整后的时间部分处理函数如下:
在这里插入图片描述

处理后pk文件经PG2Net导出并处理格式

1、改写PG2Net读取pk文件部分
在这里插入图片描述

2、对train数据和test数据读出后暂存在列表,经过函数处理后添加表头以及调整格式分别保存到csv
在这里插入图片描述

3、设置采样率为100%以打乱数据顺序

数据导入GETNext模型并在服务器训练

1、将数据放入GETNext构图函数,构图后得到训练所需文件
在这里插入图片描述
2、训练在服务器上进行,epoch设置为40,训练结果与PG2Net对比如下
在这里插入图片描述

2 CDRs

数据经DeepMove方式处理

1、CDR数据集没有POI种类并且对POI没有编号,首先对POI进行编号,处理方式为构建编号字典,如果经纬度完全相同则认为是同一个地点编号相同;同时对时间格式进行处理,处理后的数据如下
在这里插入图片描述
2、与NYC类似将符合deepmove格式的数据导入并进行处理,处理后得到pk文件

处理后pk文件经PG2Net导出并处理格式

1、将pk文件导入PG2Next,然后做法与NYC相同,改写了原PG2Net读取pk文件的函数,结果暂存列表调整格式增加表头后转为csv保存,得到train和test对应的csv文件
在这里插入图片描述
在这里插入图片描述

数据导入GETNext模型并训练

1、将处理好的train.csv导入GETNext进行构图,得到25g大的csv…。。。
2、采取采样的方式,采样5%,进行构图后得到11g左右大的csv
在这里插入图片描述
3、项目在服务器进行训练,epoch设为40,训练完后结果如下

在这里插入图片描述

这篇关于POI推荐实战1:将NYC及CDRs处理后在GETNext运行的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/804596

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

无人叉车3d激光slam多房间建图定位异常处理方案-墙体画线地图切分方案

墙体画线地图切分方案 针对问题:墙体两侧特征混淆误匹配,导致建图和定位偏差,表现为过门跳变、外月台走歪等 ·解决思路:预期的根治方案IGICP需要较长时间完成上线,先使用切分地图的工程化方案,即墙体两侧切分为不同地图,在某一侧只使用该侧地图进行定位 方案思路 切分原理:切分地图基于关键帧位置,而非点云。 理论基础:光照是直线的,一帧点云必定只能照射到墙的一侧,无法同时照到两侧实践考虑:关

如何用Docker运行Django项目

本章教程,介绍如何用Docker创建一个Django,并运行能够访问。 一、拉取镜像 这里我们使用python3.11版本的docker镜像 docker pull python:3.11 二、运行容器 这里我们将容器内部的8080端口,映射到宿主机的80端口上。 docker run -itd --name python311 -p

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

C#实战|大乐透选号器[6]:实现实时显示已选择的红蓝球数量

哈喽,你好啊,我是雷工。 关于大乐透选号器在前面已经记录了5篇笔记,这是第6篇; 接下来实现实时显示当前选中红球数量,蓝球数量; 以下为练习笔记。 01 效果演示 当选择和取消选择红球或蓝球时,在对应的位置显示实时已选择的红球、蓝球的数量; 02 标签名称 分别设置Label标签名称为:lblRedCount、lblBlueCount

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

防近视护眼台灯什么牌子好?五款防近视效果好的护眼台灯推荐

在家里,灯具是属于离不开的家具,每个大大小小的地方都需要的照亮,所以一盏好灯是必不可少的,每个发挥着作用。而护眼台灯就起了一个保护眼睛,预防近视的作用。可以保护我们在学习,阅读的时候提供一个合适的光线环境,保护我们的眼睛。防近视护眼台灯什么牌子好?那我们怎么选择一个优秀的护眼台灯也是很重要,才能起到最大的护眼效果。下面五款防近视效果好的护眼台灯推荐: 一:六个推荐防近视效果好的护眼台灯的

滚雪球学Java(87):Java事务处理:JDBC的ACID属性与实战技巧!真有两下子!

咦咦咦,各位小可爱,我是你们的好伙伴——bug菌,今天又来给大家普及Java SE啦,别躲起来啊,听我讲干货还不快点赞,赞多了我就有动力讲得更嗨啦!所以呀,养成先点赞后阅读的好习惯,别被干货淹没了哦~ 🏆本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,助你一臂之力,带你早日登顶🚀,欢迎大家关注&&收藏!持续更新中,up!up!up!! 环境说明:Windows 10