无处不在的推荐系统

2024-04-03 02:48
文章标签 系统 推荐 无处不在

本文主要是介绍无处不在的推荐系统,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这篇博客由微软主要研究者Thore Graepel执笔并发表。

博客正文

好的推荐任何地方都用得着。无论是找一部你可能喜欢的电影,或者一本你可能感兴趣的书籍,甚至是寻求facebook或linkedin上志同道合的朋友,自动推荐系统将会是个得力助手。刚开始自动推荐系统只限于网络用户,如今,随着微软Azure机器学习的不断普及,越来越多的人可以享受到自动推荐系统的优质服务,小到个人大到企业,为其客户带来便利。

自推系统如何是如何运作的?

一般而言,推荐系统是个二元体系,一个是”用户”,另一个是”商品”。用户指推荐物品的对象人群,”商品”指你想要推荐的物品,可以是电影,书籍,网页,菜谱,甚至是网友。

举个例子,假如我想给一个指定用户推荐饭店,参考该用户以及其他用户对其中一些饭店的历史评价(五星评价标准)。我们的推荐任务可以分两步走:

  • 预测该用户会如何评价每个饭店(五星评价标准)。
  • 从一份合格饭店清单中选出该用户可能会给出最高评分的饭店。

但是如果某个用户没有评价过这些饭店,那我们如何预测该用户的评价走向呢?机器学习发挥作用的时候到了。

如何预测评价?

针对”用户–商品”这种模式,我们需要收集各种形式的数据(用户ID,商品ID,评价等)来建立一个机器学习预测性模型,预测用户的评价走向。

你可以把它想成一个大型矩阵,用户为行,商品为列,而评分就是元素。大数据

这是个稀疏矩阵(大量条目缺失),因为普通用户只会给一小部分商品评分。Azure中贝叶斯推荐系统小工具(Bayesian RS implemented接收这些训练数据,设计相应的模型,预测该用户的评价结果,应用于“用户–商品”模式。评价标准不限于五星评级,只要不要涉及到隐私,比如购买次数,点击量或购买所花时间等判断标准也同样可行。

以上是如何做到的呢?

RS将用户和商品嵌入我们称之为潜在特质空间的地方(见下图)。如果用户(蓝点)和商品(红点)向量方向一致,那么该用户对该商品评价很高。反之则评价一般。特质空间里,相关用户和相似商品会放到一起,使”指定用户——商品”模式下预测用户评价成为可能,而训练数据库里是不提供评价的。

下图是一个二维特质空间,用来作阐述说明,而我们系统中使用20-100个维度的特质空间来分析。有时我们可以发现一些可以解释的特质,举个例子。南北走向的特质可能指“成人”和“小孩”,而东西走向的特质可能为“主流”和“小众”。大数据

面对新用户和新商品如何作出预测?

RS的唯一问题在于它属于慢热型产品。新用户作评价的次数不多,新商品收到的评价数也寥寥无几,因此很难作出预测。为了改善这一问题,Azure不仅使用ID来表示用户和商品,还使用了一种由元数据构成的特质向量。代表用户的特质向量包含所有个人信息,比如年龄,所在地等;代表电影的特质向量包括电影题材,演员,导演,上映日期等。最后,系统会利用元数据中的共同特质整合出相关用户和相似商品。

了解更多

如果你对自动推荐系统很好奇,可以看看Matchbox的论文: Large Scale Bayesian Recommendations.

如果你想建立自己的推荐系统传送通道,等Azure机器学习正式发布后,可以自己动手尝试一下。

下图所示的Azure机器学习工作室,备有一个推荐系统模板和功能强大的浏览器支持的用户界面,还有”拖动”功能,让整个过程变得相对简单。大数据

事实上,Azure机器学习预测用户评价结果包括两大模式——内容筛选和协作筛选。最后通过普及该应用,我们希望会有更多的人使用自动推荐系统,并在各种场合中发挥作用。

来自:http://www.36dsj.com/archives/28944

这篇关于无处不在的推荐系统的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/871717

相关文章

前端 CSS 动态设置样式::class、:style 等技巧(推荐)

《前端CSS动态设置样式::class、:style等技巧(推荐)》:本文主要介绍了Vue.js中动态绑定类名和内联样式的两种方法:对象语法和数组语法,通过对象语法,可以根据条件动态切换类名或样式;通过数组语法,可以同时绑定多个类名或样式,此外,还可以结合计算属性来生成复杂的类名或样式对象,详细内容请阅读本文,希望能对你有所帮助...

Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)

《Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)》本文介绍了如何使用Python和Selenium结合ddddocr库实现图片验证码的识别和点击功能,感兴趣的朋友一起看... 目录1.获取图片2.目标识别3.背景坐标识别3.1 ddddocr3.2 打码平台4.坐标点击5.图

Java中实现订单超时自动取消功能(最新推荐)

《Java中实现订单超时自动取消功能(最新推荐)》本文介绍了Java中实现订单超时自动取消功能的几种方法,包括定时任务、JDK延迟队列、Redis过期监听、Redisson分布式延迟队列、Rocket... 目录1、定时任务2、JDK延迟队列 DelayQueue(1)定义实现Delayed接口的实体类 (

shell脚本自动删除30天以前的文件(最新推荐)

《shell脚本自动删除30天以前的文件(最新推荐)》该文章介绍了如何使用Shell脚本自动删除指定目录下30天以前的文件,并通过crontab设置定时任务,此外,还提供了如何使用Shell脚本删除E... 目录shell脚本自动删除30天以前的文件linux按照日期定时删除elasticsearch索引s

在不同系统间迁移Python程序的方法与教程

《在不同系统间迁移Python程序的方法与教程》本文介绍了几种将Windows上编写的Python程序迁移到Linux服务器上的方法,包括使用虚拟环境和依赖冻结、容器化技术(如Docker)、使用An... 目录使用虚拟环境和依赖冻结1. 创建虚拟环境2. 冻结依赖使用容器化技术(如 docker)1. 创

CentOS系统Maven安装教程分享

《CentOS系统Maven安装教程分享》本文介绍了如何在CentOS系统中安装Maven,并提供了一个简单的实际应用案例,安装Maven需要先安装Java和设置环境变量,Maven可以自动管理项目的... 目录准备工作下载并安装Maven常见问题及解决方法实际应用案例总结Maven是一个流行的项目管理工具

MySQL 缓存机制与架构解析(最新推荐)

《MySQL缓存机制与架构解析(最新推荐)》本文详细介绍了MySQL的缓存机制和整体架构,包括一级缓存(InnoDBBufferPool)和二级缓存(QueryCache),文章还探讨了SQL... 目录一、mysql缓存机制概述二、MySQL整体架构三、SQL查询执行全流程四、MySQL 8.0为何移除查

MySql9.1.0安装详细教程(最新推荐)

《MySql9.1.0安装详细教程(最新推荐)》MySQL是一个流行的关系型数据库管理系统,支持多线程和多种数据库连接途径,能够处理上千万条记录的大型数据库,本文介绍MySql9.1.0安装详细教程,... 目录mysql介绍:一、下载 Mysql 安装文件二、Mysql 安装教程三、环境配置1.右击此电脑

在 Windows 上安装 DeepSeek 的完整指南(最新推荐)

《在Windows上安装DeepSeek的完整指南(最新推荐)》在Windows上安装DeepSeek的完整指南,包括下载和安装Ollama、下载DeepSeekRXNUMX模型、运行Deep... 目录在www.chinasem.cn Windows 上安装 DeepSeek 的完整指南步骤 1:下载并安装

深入理解Apache Airflow 调度器(最新推荐)

《深入理解ApacheAirflow调度器(最新推荐)》ApacheAirflow调度器是数据管道管理系统的关键组件,负责编排dag中任务的执行,通过理解调度器的角色和工作方式,正确配置调度器,并... 目录什么是Airflow 调度器?Airflow 调度器工作机制配置Airflow调度器调优及优化建议最