本文主要是介绍无处不在的推荐系统,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
这篇博客由微软主要研究者Thore Graepel执笔并发表。
博客正文
好的推荐任何地方都用得着。无论是找一部你可能喜欢的电影,或者一本你可能感兴趣的书籍,甚至是寻求facebook或linkedin上志同道合的朋友,自动推荐系统将会是个得力助手。刚开始自动推荐系统只限于网络用户,如今,随着微软Azure机器学习的不断普及,越来越多的人可以享受到自动推荐系统的优质服务,小到个人大到企业,为其客户带来便利。
自推系统如何是如何运作的?
一般而言,推荐系统是个二元体系,一个是”用户”,另一个是”商品”。用户指推荐物品的对象人群,”商品”指你想要推荐的物品,可以是电影,书籍,网页,菜谱,甚至是网友。
举个例子,假如我想给一个指定用户推荐饭店,参考该用户以及其他用户对其中一些饭店的历史评价(五星评价标准)。我们的推荐任务可以分两步走:
- 预测该用户会如何评价每个饭店(五星评价标准)。
- 从一份合格饭店清单中选出该用户可能会给出最高评分的饭店。
但是如果某个用户没有评价过这些饭店,那我们如何预测该用户的评价走向呢?机器学习发挥作用的时候到了。
如何预测评价?
针对”用户–商品”这种模式,我们需要收集各种形式的数据(用户ID,商品ID,评价等)来建立一个机器学习预测性模型,预测用户的评价走向。
你可以把它想成一个大型矩阵,用户为行,商品为列,而评分就是元素。
这是个稀疏矩阵(大量条目缺失),因为普通用户只会给一小部分商品评分。Azure中贝叶斯推荐系统小工具(Bayesian RS implemented接收这些训练数据,设计相应的模型,预测该用户的评价结果,应用于“用户–商品”模式。评价标准不限于五星评级,只要不要涉及到隐私,比如购买次数,点击量或购买所花时间等判断标准也同样可行。
以上是如何做到的呢?
RS将用户和商品嵌入我们称之为潜在特质空间的地方(见下图)。如果用户(蓝点)和商品(红点)向量方向一致,那么该用户对该商品评价很高。反之则评价一般。特质空间里,相关用户和相似商品会放到一起,使”指定用户——商品”模式下预测用户评价成为可能,而训练数据库里是不提供评价的。
下图是一个二维特质空间,用来作阐述说明,而我们系统中使用20-100个维度的特质空间来分析。有时我们可以发现一些可以解释的特质,举个例子。南北走向的特质可能指“成人”和“小孩”,而东西走向的特质可能为“主流”和“小众”。
面对新用户和新商品如何作出预测?
RS的唯一问题在于它属于慢热型产品。新用户作评价的次数不多,新商品收到的评价数也寥寥无几,因此很难作出预测。为了改善这一问题,Azure不仅使用ID来表示用户和商品,还使用了一种由元数据构成的特质向量。代表用户的特质向量包含所有个人信息,比如年龄,所在地等;代表电影的特质向量包括电影题材,演员,导演,上映日期等。最后,系统会利用元数据中的共同特质整合出相关用户和相似商品。
了解更多
如果你对自动推荐系统很好奇,可以看看Matchbox的论文: Large Scale Bayesian Recommendations.
如果你想建立自己的推荐系统传送通道,等Azure机器学习正式发布后,可以自己动手尝试一下。
下图所示的Azure机器学习工作室,备有一个推荐系统模板和功能强大的浏览器支持的用户界面,还有”拖动”功能,让整个过程变得相对简单。
事实上,Azure机器学习预测用户评价结果包括两大模式——内容筛选和协作筛选。最后通过普及该应用,我们希望会有更多的人使用自动推荐系统,并在各种场合中发挥作用。
来自:http://www.36dsj.com/archives/28944
这篇关于无处不在的推荐系统的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!