google news recommendation - 基于点击行为的用户个性化新闻推荐

本文主要是介绍google news recommendation - 基于点击行为的用户个性化新闻推荐,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1 摘要

2 简介
新闻阅读,随着互联网的发展,访问方式已经从订阅纸质媒体扩展到访问数目众多的网络新闻源。新闻聚集网站如google news、yahoo news,从不同的新闻网站采集数据,并提供一个聚合的视图。对于这样的新闻服务网站来说,一个严重的问题是文章的数目对于用户来说是巨大的。因此挑战是如何帮助用户找到他们感兴趣的新闻 (听上去好有诱惑力呀)
基于内容的推荐是解决信息过载问题的技术方案。基于兴趣和倾向的用户profile,系统为用户推荐感兴趣或带来价值的物品。
基于内容的方法,在推荐系统中扮演着核心的角色,因为它能够推荐以前并没有被评估过的信息,并且能够适应用户的个性上的差异。这项技术被应用在了不同的领域,如邮件、新闻、搜索等。在新闻领域,基于内容的推荐技术目标在于根据用户的兴趣聚合新闻,并且为每位用户创造一份属于自己的“新闻报纸” (想想一份报纸有什么内容,以及如何解决用户的问题,并让用户可信赖)

我们组合了基于内容的方法和之前开发的协同过滤的方法,来产生新闻访问的个性化推荐。组合方法在线上进行了评估:一部分Google News的线上流量使用了混合算法,结果表明有了较大提升。线上实验也揭露了一些有趣的话题,比如推荐、偶然访问、用户满意度等。

新闻阅读的自然属性,是新闻推荐与其它领域基于内容的推荐不同。当访问一个新闻站点,用户来寻找新的信息,这些信息是以前不知道的,甚至是带来惊喜的。
既然用户的profile是从过去的行为推断的,很重要的是要知道用户的新闻兴趣发生了改变,以及以过去的用户行为来预测将来的行为是否有效。

为了理解这个问题,我们实施了一个基于Google News的大规模的日志分析,来衡量用户新闻兴趣的稳定性。我们发现用户的兴趣随着时间有所变化,并且follow新闻事件的趋势。
基于这些发现,我们实现了一个贝叶斯模型,来预测:根据某个用户的行为,预测该用户的兴趣;根据一组用户的行为,预测新闻趋势。

为了推荐新闻给用户,系统考虑了用户的真实兴趣和新闻趋势。

因此用户将收到基于用户兴趣而裁剪的新闻,同时又不会错过重要的新闻事件,即使这些事件并不是严格的匹配用户的特殊兴趣。

本文的贡献有三方面:
(1)对用户新闻兴趣的一致性,进行了大规模的日志分析;(2)提出了一个基于组合了用户真实兴趣和新闻趋势的点击行为,来预测用户兴趣的新颖方法;(3)提出了一个基于内容推荐和协同过滤的组合个性化新闻推荐方法,并在真实流量上进行了实验,并取得了提高。

3 google新闻的个性化

4 相关工作

5 用户兴趣的日志分析

6 数据

7 点击分布
Google News把新闻文章分类到预先定义好的话题类别中,包括国际、体育、娱乐等。在日志分析中,我们会计算每个用户在每个类别中的点击分布。
我们将过去的时间分成12个月。因此对于每一个用户u,我们计算他在每个月t中的在各个主题列表中的点击分布D(u,t),用一个向量表示:

其中,Ni为分类到Ci中的文章的点击数。Ntotal为用户在过去时间段内总的点击数( 不是时间段t的总点击

8 不同时间用户的新闻兴趣变化

9 新闻趋势
除了单个用户的点击分布,我们还计算了不同国家地区的公众点击分布。对于每一个国家,公众兴趣可以用该地区用户、在过去时间段t的所有点击分布来表示。
Fiture2显示了美国人群的点击分布。为了阐明图示,只显示了四个分类。我们可以看出美国人群的公众兴趣是有波动的,其它国家的图示也是符合这一现象。一些分类的波动比如社会比健康等类别的波动更大。
我们假定一个国家公众兴趣的变化受该国重点事件影响,日志分析为这一假定提供了经验型证据。

10 热点事件对个体兴趣的影响

11 用户兴趣预测的贝叶斯模型
日志分析揭示单个用户的兴趣,受当地新闻趋势的影响。比如在欧洲杯期间,西班牙用户会点击更多的体育新闻。相似的现象,在针对用户的兴趣周期研究中报道过。基于这些发现,我们将用户的兴趣分成两部分:用户的真实兴趣和受当地新闻影响的兴趣。用户的真实兴趣由用户的特性产生,比如用户的性别、年龄、职业等,并且相对稳定。另一方面,在决定读什么的时候,用户受当地新闻影响。这种影响是短期的,并且随着时间容易改变。用户的真实兴趣和新闻影响分别对应于[1]中的长期兴趣和短期兴趣。我们使用更清晰的方法来预测用户的兴趣。更重要的,我们通过使用公众的点击模式,从新闻趋势的角度,为用户的短期兴趣建模,而不仅是用户的单独的反馈。

我们使用贝叶斯框架, 开发了一种方法,基于用户和用户所在地区的点击模式(click patterns),预测用户的当前兴趣。预测的兴趣在新闻推荐中使用。
方法如下:
(1)系统使用用户在过去每一段时间的点击,预测用户的真实兴趣,不管当前的新闻趋势;
(2)针对各个时间段的预测结果,组合起来得到一个更精确的用户的真是兴趣;
(3)系统通过用户的真实兴趣和当地的新闻趋势,预测用户的当前兴趣。

12 用户真实新闻兴趣的预测
对于过去每个特定的时间段t,我们得到某个用户的点击分布D(u,t),以及该地区内所有用户的点击分布D(t),代表了该地区的新闻趋势。
我们要从D(u,t)中挖掘用户u的真实兴趣,而不受D(t)的影响。一个用户对某个类别Ci的真是兴趣建模为:

即用户点击类别Ci的概率。使用贝叶斯规则,上述公式计算为:

其中:


13 用户当前新闻兴趣的预测

14 新闻推荐

15 线上流量实验

16 结论和后续工作

这篇关于google news recommendation - 基于点击行为的用户个性化新闻推荐的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/506127

相关文章

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

【测试】输入正确用户名和密码,点击登录没有响应的可能性原因

目录 一、前端问题 1. 界面交互问题 2. 输入数据校验问题 二、网络问题 1. 网络连接中断 2. 代理设置问题 三、后端问题 1. 服务器故障 2. 数据库问题 3. 权限问题: 四、其他问题 1. 缓存问题 2. 第三方服务问题 3. 配置问题 一、前端问题 1. 界面交互问题 登录按钮的点击事件未正确绑定,导致点击后无法触发登录操作。 页面可能存在

防近视护眼台灯什么牌子好?五款防近视效果好的护眼台灯推荐

在家里,灯具是属于离不开的家具,每个大大小小的地方都需要的照亮,所以一盏好灯是必不可少的,每个发挥着作用。而护眼台灯就起了一个保护眼睛,预防近视的作用。可以保护我们在学习,阅读的时候提供一个合适的光线环境,保护我们的眼睛。防近视护眼台灯什么牌子好?那我们怎么选择一个优秀的护眼台灯也是很重要,才能起到最大的护眼效果。下面五款防近视效果好的护眼台灯推荐: 一:六个推荐防近视效果好的护眼台灯的

智能交通(二)——Spinger特刊推荐

特刊征稿 01  期刊名称: Autonomous Intelligent Systems  特刊名称: Understanding the Policy Shift  with the Digital Twins in Smart  Transportation and Mobility 截止时间: 开放提交:2024年1月20日 提交截止日

Vue3项目开发——新闻发布管理系统(六)

文章目录 八、首页设计开发1、页面设计2、登录访问拦截实现3、用户基本信息显示①封装用户基本信息获取接口②用户基本信息存储③用户基本信息调用④用户基本信息动态渲染 4、退出功能实现①注册点击事件②添加退出功能③数据清理 5、代码下载 八、首页设计开发 登录成功后,系统就进入了首页。接下来,也就进行首页的开发了。 1、页面设计 系统页面主要分为三部分,左侧为系统的菜单栏,右侧

【Kubernetes】K8s 的安全框架和用户认证

K8s 的安全框架和用户认证 1.Kubernetes 的安全框架1.1 认证:Authentication1.2 鉴权:Authorization1.3 准入控制:Admission Control 2.Kubernetes 的用户认证2.1 Kubernetes 的用户认证方式2.2 配置 Kubernetes 集群使用密码认证 Kubernetes 作为一个分布式的虚拟

消除安卓SDK更新时的“https://dl-ssl.google.com refused”异常的方法

消除安卓SDK更新时的“https://dl-ssl.google.com refused”异常的方法   消除安卓SDK更新时的“https://dl-ssl.google.com refused”异常的方法 [转载]原地址:http://blog.csdn.net/x605940745/article/details/17911115 消除SDK更新时的“

C# 防止按钮botton重复“点击”的方法

在使用C#的按钮控件的时候,经常我们想如果出现了多次点击的时候只让其在执行的时候只响应一次。这个时候很多人可能会想到使用Enable=false, 但是实际情况是还是会被多次触发,因为C#采用的是消息队列机制,这个时候我们只需要在Enable = true 之前加一句 Application.DoEvents();就能达到防止重复点击的问题。 private void btnGenerateSh

开放式耳机好用?平价开放式耳机推荐?四款开放式的蓝牙耳机推荐

开放式耳机好用吗?有平价些的开放式耳机推荐吗?那这两个问题的回答当然是肯定的。 首先开放式耳机好不好用取决于对耳机的需求,因为开放式耳机其实是比较适用于需要注意周围环境、需要‌长时间佩戴舒适以及需要频繁与人交流的场景中,在这些场景下使用开放式耳机的话就会比较有优势。就例如跑步骑行健身等运动的时候,能够兼得佩戴舒适度的同时,增加一定的安全性;还有在办公学习的时候,会很适合长时间佩戴,能够方便和