【MindSpore:跟着小Mi机器学习】推荐系统

2024-01-07 16:32

本文主要是介绍【MindSpore:跟着小Mi机器学习】推荐系统,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一周未见,甚是想念,今天小Mi带大家学习推荐系统(Recommender Systems)!推荐系统是机器学习中一个很重要的应用,比如某易推荐的歌曲呀,某宝推荐的购物清单呀等等,既然应该这么广泛,那就废话不多说,我们开始吧~

定义

推荐系统是个很有意思的问题,机器学习的学术会议上通常不太会关注推荐系统问题,但是在我们生活中却随处可见。

同时对机器学习来说,特征是很重要的,选择的特征将对学习算法的性能有很大影响。因此,在机器学习中有一种大思想,针对一些问题,可以通过算法自动学习一套比较好的特征,从而代替手动设计,其中推荐系统就是类型设置的一个例子。

那么什么是推荐系统问题呢?我们从一个例子开始定义推荐系统的问题。

假使一个电影供应商有5部电影和4个用户,我们要求用户为电影打分。

前三部电影是爱情片,后两部则是动作片,图中可以发现Alice和Bob似乎更倾向与爱情片,而Carol和Dave似乎更倾向与动作片,同时每个用户都并未给全部的电影都打过分。这时可以构建一个算法,预测每个人可能会给各自没看过的电影打多少分,并以此作为推荐的依据。

下面引入一些相关参数:

:用户数量;

:电影数量;

:如果用户

给电影

评过分,则

:用户

给电影

的评分;

:用户

评过分的电影总数。

特征与算法

在一个基于内容的推荐系统算法中,对于用户希望推荐的电影有一些数据,而这些数据更准确地说就是相关的特征。

假设每部电影都有两个特征,

如代表电影的浪漫程度,

代表电影的动作程度。

那么每部电影都有一个特征向量,如

是第一部电影的特征向量:[0.9 0]。

基于这些特征来构建一个推荐系统算法,采用线性回归模型,我们可以针对每一个用户都训练一个线性回归模型,如

是第一个用户的模型参数。于是就有:

:用户

的参数向量;

:电影

的特征向量;

对于用户

和电影

,我们预测评分为:

代价函数

针对用户

,该线性回归模型的代价为预测误差的平方和,加上正则化项:

其中

表示只计算那些用户

评过分的电影。在一般的线性回归模型中,误差项和正则项应该都是乘以

,在这里的话我们选择将

去掉,同时也不会对方差项

进行正则化处理。

上面的代价函数只是针对一个用户的,为了学习所有用户,将所有用户的代价函数求和:

如果要用梯度下降法来求解最优解,计算代价函数的偏导数后得到梯度下降的更新公式为:

3 协同过滤

在基于内容的推荐系统中,对于每一部电影,我们都掌握了可用的特征,使用这些特征训练出了每一个用户的参数。举一反三,如果我们拥有用户的参数,那么其实也可以学习得出电影的特征,有没有?!

但是如果既没有用户的参数,也没有电影的特征,那么应该如何解决呢?不用担心,协同过滤算法闪亮登场~

优化目标将同时针对

进行,对代价函数求偏导数的结果如下:

注:在协同过滤算法中,通常不使用方差项,如果需要的话,算法会自动学得。 协同过滤算法使用步骤如下:

1.初始

为一些随机小值

2.使用梯度下降算法最小化代价函数

3.在训练完算法后,预测

为用户

给电影

的评分

通过这个学习过程获得的特征矩阵包含了有关电影的重要数据,可以用这些数据作为给用户推荐电影的依据。

例如,如果一位用户正在观看电影

,寻找另一部电影

,依据两部电影的特征向量之间的距离大小

,距离越小,那么

就越符合该用户的品味。

4 协同过滤算法

协同过滤优化目标:

给定

,估计:

给定

,估计

,同时最小化

算法的向量化实现

根据五部电影的数据集,将这些用户的电影评分,进行分组并存到一个矩阵中。

由于数据集有五部电影和四位用户,那么这个矩阵Y就是一个5行4列的矩阵,同时包含了这些电影的用户评分数据:

推出评分:

找到相关影片:

前期小Mi已经带大家对特征参数向量进行了学习,那么其实如何度量两部电影之间的相似性就很好解决啦。例如说:电影

有一个特征向量

,而另一部不同的电影

,只要保证两部电影的特征向量之间的距离

很小,那就能很有力地表明电影

和电影

在某种程度上有相似,至少在某种意义上,某些人喜欢电影

,或许更有可能也对电影

感兴趣。也就是说,当用户在看某部电影

的时候,如果需要找出5部与电影

非常相似的电影,为了能给用户推荐5部新电影,我们需要做的是找出电影

,在这些不同的电影中与我们要找的电影

的距离最小,这样你就能给你的用户推荐几部不同的电影了。

通过这个方法,相信大家可以知道,应该如何进行一个向量化的计算来对所有的用户和所有的电影进行评分计算,同时也能掌握通过学习特征参数,来找到相关电影和产品的方法。

6 均值归一化

用户评分数据:

如果新增一个用户Sky,并且Sky没有为任何电影评分,那么我们以什么为依据为Sky推荐电影呢?

首先需要对矩阵Y进行均值归一化处理,将每一个用户对某一部电影的评分减去所有用户对该电影评分的平均值:

然后利用这个新的矩阵来训练算法,如果我们要用新训练出的算法来预测评分,则需要将平均值重新加回去,预测

,而对于用户Sky,新模型会认为她给每部电影的评分都是该电影的平均分。

好啦,对于推荐系统的学习就先到这咯~下周小Mi给大家安排大规模机器学习!我们,下周再见呦(挥手十分钟!)

这篇关于【MindSpore:跟着小Mi机器学习】推荐系统的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/580551

相关文章

Nginx配置系统服务&设置环境变量方式

《Nginx配置系统服务&设置环境变量方式》本文介绍了如何将Nginx配置为系统服务并设置环境变量,以便更方便地对Nginx进行操作,通过配置系统服务,可以使用系统命令来启动、停止或重新加载Nginx... 目录1.Nginx操作问题2.配置系统服android务3.设置环境变量总结1.Nginx操作问题

Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)

《Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)》文章介绍了如何使用dhtmlx-gantt组件来实现公司的甘特图需求,并提供了一个简单的Vue组件示例,文章还分享了一... 目录一、首先 npm 安装插件二、创建一个vue组件三、业务页面内 引用自定义组件:四、dhtmlx

CSS3 最强二维布局系统之Grid 网格布局

《CSS3最强二维布局系统之Grid网格布局》CS3的Grid网格布局是目前最强的二维布局系统,可以同时对列和行进行处理,将网页划分成一个个网格,可以任意组合不同的网格,做出各种各样的布局,本文介... 深入学习 css3 目前最强大的布局系统 Grid 网格布局Grid 网格布局的基本认识Grid 网

前端 CSS 动态设置样式::class、:style 等技巧(推荐)

《前端CSS动态设置样式::class、:style等技巧(推荐)》:本文主要介绍了Vue.js中动态绑定类名和内联样式的两种方法:对象语法和数组语法,通过对象语法,可以根据条件动态切换类名或样式;通过数组语法,可以同时绑定多个类名或样式,此外,还可以结合计算属性来生成复杂的类名或样式对象,详细内容请阅读本文,希望能对你有所帮助...

Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)

《Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)》本文介绍了如何使用Python和Selenium结合ddddocr库实现图片验证码的识别和点击功能,感兴趣的朋友一起看... 目录1.获取图片2.目标识别3.背景坐标识别3.1 ddddocr3.2 打码平台4.坐标点击5.图

Java中实现订单超时自动取消功能(最新推荐)

《Java中实现订单超时自动取消功能(最新推荐)》本文介绍了Java中实现订单超时自动取消功能的几种方法,包括定时任务、JDK延迟队列、Redis过期监听、Redisson分布式延迟队列、Rocket... 目录1、定时任务2、JDK延迟队列 DelayQueue(1)定义实现Delayed接口的实体类 (

shell脚本自动删除30天以前的文件(最新推荐)

《shell脚本自动删除30天以前的文件(最新推荐)》该文章介绍了如何使用Shell脚本自动删除指定目录下30天以前的文件,并通过crontab设置定时任务,此外,还提供了如何使用Shell脚本删除E... 目录shell脚本自动删除30天以前的文件linux按照日期定时删除elasticsearch索引s

Java深度学习库DJL实现Python的NumPy方式

《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

在不同系统间迁移Python程序的方法与教程

《在不同系统间迁移Python程序的方法与教程》本文介绍了几种将Windows上编写的Python程序迁移到Linux服务器上的方法,包括使用虚拟环境和依赖冻结、容器化技术(如Docker)、使用An... 目录使用虚拟环境和依赖冻结1. 创建虚拟环境2. 冻结依赖使用容器化技术(如 docker)1. 创

CentOS系统Maven安装教程分享

《CentOS系统Maven安装教程分享》本文介绍了如何在CentOS系统中安装Maven,并提供了一个简单的实际应用案例,安装Maven需要先安装Java和设置环境变量,Maven可以自动管理项目的... 目录准备工作下载并安装Maven常见问题及解决方法实际应用案例总结Maven是一个流行的项目管理工具