推荐系统公平性之校准化推荐--calibrated recommendations

2023-10-23 12:30

本文主要是介绍推荐系统公平性之校准化推荐--calibrated recommendations,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

主要参考论文:论文1《Calibrated Recommendations》、论文2《Crank up the volume: preference bias amplification in collaborative recommendation》

推荐系统中的偏好放大现象(preference bias amplification)

你是否有过这样的经历:某天在淘宝搜索了一样东西后,接下了一段时间的推荐都是关于这个物品的,哪怕你已经购买了这个物品或者你只是简单地搜来瞧瞧;在抖音上给某些视频点了赞,后面抖音会疯狂推荐这类视频给你,尽管你已经不想看这类视频了。

再举个直观的例子,佩琪在购物网站上购买了3条裙子和1双鞋子,那么接下来推荐系统会怎么给她推荐呢?
在这里插入图片描述
有很大的可能是,推荐系统只给她推荐裙子,因为推荐系统放大了她对裙子的偏好,从而忽略了她对鞋子的偏好。这可能给佩琪带来不好的使用体验。
在这里插入图片描述
换句话说,推荐系统的这种偏好放大现象将逐渐缩小用户的兴趣范围,类似于回声室效应。这对于推荐系统中的各个利益相关者都是不利的:
对于用户来说会让他们看到的东西越来越单一,丧失了多元化,让用户看不到本来想要的东西或者未来会感兴趣的东西。
对于物品方而言,部分类别的物品,特别是小众的物品,可能很少会有展示的机会。
对于推荐平台,就意味着这款APP让用户觉得乏味,没有用户粘度,从而造成用户流失。

为什么会出现偏好放大现象

  1. 从类别不平衡的分类问题角度来看。在类别不平衡的分类问题中,如果我们没有其他可用的信息,那么将结果全部预测为最多的那一类就可以得到最高的准确率。对于推荐来说,继续用上面的例子,如果我们没有别的可用信息,只知道佩琪购买的物品中75%都是裙子,那么我们只推荐裙子给她就可以得到最好的准确率。

  2. 从模型训练的角度来看。以BPR训练为例,在训练过程中为每个用户采样正样本时,数量占比多的类别被采样到的概率更大,所以训练时这种偏差就刻入模型中了,但这本不是错,相反这恰恰是个性化推荐所需要的,但错在往往得到的推荐结果会过分放大这种偏差,而没有维持住原有的比例。

校准化推荐(calibrated recommendations)

由于推荐系统存在的偏好放大现象,我们需要让推荐系统的结果更加符合用户的原始偏好,校准化推荐应运而生。用论文1中的例子:假设在某个用户的观影记录中,有70部爱情类电影和30部动作类电影,那么在推荐列表中的爱情类电影应该占70%,同时动作类电影应该占30%,这样就与用户的偏好相符。我们把推荐列表的这种特性称为校准(calibration)。

规范化描述,校准推荐的目标是让推荐列表按照合适的比例反映用户的兴趣偏好。

校准(calibration)与多样性(diversity)

典型的多样性的优化目标是最小化推荐列表中各物品间的相似度,用上面的例子来说,一个多样性的推荐列表只需要保证同时有爱情类电影和动作类电影就好了,当然如果有其他类别的电影,也应该加入到列表中,而且最好每种类别数量相等。

但calibration强调的是推荐列表中的各类别的电影要满足一定的比例,即尽可能地吻合用户的兴趣偏好。但却不具备多样性那样可以发现用户潜在兴趣类别的性质。

如何度量校准(calibration metrics)

  1. 为了评估我们的推荐结果和用户原始的兴趣偏好间的差异,我们可以假设用户历史记录中类别的分布为,推荐列表中类别分布为,那么可以计算两个分布间的f-散度(f-divergence)来量化它们间差异,值越小说明分布越接近,calibration就做得越好。
    如上面与多样性的对比时所述,如果我们想要让推荐结果的类型不那么死板,希望稍微地引入一些其他类别,以发现用户的潜在兴趣,我们可以让没出现在用户历史中的类别所对应的不为零。

  2. 我更偏爱论文2采用的指标:bias disparity。其同样是通过计算输入数据中的偏好与系统输出中的偏好间的差异(公式具体见论文2)。它既可以用来计算推荐系统对所有用户的偏好放大情况,也可以分别推荐系统对计算不同组(如男性和女性)的用户的偏好放大情况,且计算简便。

如何实现校准

在训练的时候,很难将calibration加入优化目标,所以实做上大多采用简单地重排序(re-rank),即先从推荐系统中得到以准确率为优化目标的推荐结果,再利用前面提到的度量指标,通过重排序来权衡准确率和calibration。

文献链接

  1. 《Calibrated Recommendations》
  2. 《Crank up the volume: preference bias amplification in collaborative recommendation》

希望我的文章可以给你们的工作或者学习带来一丝灵感,共勉~

这篇关于推荐系统公平性之校准化推荐--calibrated recommendations的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/267836

相关文章

Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)

《Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)》文章介绍了如何使用dhtmlx-gantt组件来实现公司的甘特图需求,并提供了一个简单的Vue组件示例,文章还分享了一... 目录一、首先 npm 安装插件二、创建一个vue组件三、业务页面内 引用自定义组件:四、dhtmlx

CSS3 最强二维布局系统之Grid 网格布局

《CSS3最强二维布局系统之Grid网格布局》CS3的Grid网格布局是目前最强的二维布局系统,可以同时对列和行进行处理,将网页划分成一个个网格,可以任意组合不同的网格,做出各种各样的布局,本文介... 深入学习 css3 目前最强大的布局系统 Grid 网格布局Grid 网格布局的基本认识Grid 网

前端 CSS 动态设置样式::class、:style 等技巧(推荐)

《前端CSS动态设置样式::class、:style等技巧(推荐)》:本文主要介绍了Vue.js中动态绑定类名和内联样式的两种方法:对象语法和数组语法,通过对象语法,可以根据条件动态切换类名或样式;通过数组语法,可以同时绑定多个类名或样式,此外,还可以结合计算属性来生成复杂的类名或样式对象,详细内容请阅读本文,希望能对你有所帮助...

Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)

《Python爬虫selenium验证之中文识别点选+图片验证码案例(最新推荐)》本文介绍了如何使用Python和Selenium结合ddddocr库实现图片验证码的识别和点击功能,感兴趣的朋友一起看... 目录1.获取图片2.目标识别3.背景坐标识别3.1 ddddocr3.2 打码平台4.坐标点击5.图

Java中实现订单超时自动取消功能(最新推荐)

《Java中实现订单超时自动取消功能(最新推荐)》本文介绍了Java中实现订单超时自动取消功能的几种方法,包括定时任务、JDK延迟队列、Redis过期监听、Redisson分布式延迟队列、Rocket... 目录1、定时任务2、JDK延迟队列 DelayQueue(1)定义实现Delayed接口的实体类 (

shell脚本自动删除30天以前的文件(最新推荐)

《shell脚本自动删除30天以前的文件(最新推荐)》该文章介绍了如何使用Shell脚本自动删除指定目录下30天以前的文件,并通过crontab设置定时任务,此外,还提供了如何使用Shell脚本删除E... 目录shell脚本自动删除30天以前的文件linux按照日期定时删除elasticsearch索引s

在不同系统间迁移Python程序的方法与教程

《在不同系统间迁移Python程序的方法与教程》本文介绍了几种将Windows上编写的Python程序迁移到Linux服务器上的方法,包括使用虚拟环境和依赖冻结、容器化技术(如Docker)、使用An... 目录使用虚拟环境和依赖冻结1. 创建虚拟环境2. 冻结依赖使用容器化技术(如 docker)1. 创

CentOS系统Maven安装教程分享

《CentOS系统Maven安装教程分享》本文介绍了如何在CentOS系统中安装Maven,并提供了一个简单的实际应用案例,安装Maven需要先安装Java和设置环境变量,Maven可以自动管理项目的... 目录准备工作下载并安装Maven常见问题及解决方法实际应用案例总结Maven是一个流行的项目管理工具

MySQL 缓存机制与架构解析(最新推荐)

《MySQL缓存机制与架构解析(最新推荐)》本文详细介绍了MySQL的缓存机制和整体架构,包括一级缓存(InnoDBBufferPool)和二级缓存(QueryCache),文章还探讨了SQL... 目录一、mysql缓存机制概述二、MySQL整体架构三、SQL查询执行全流程四、MySQL 8.0为何移除查

MySql9.1.0安装详细教程(最新推荐)

《MySql9.1.0安装详细教程(最新推荐)》MySQL是一个流行的关系型数据库管理系统,支持多线程和多种数据库连接途径,能够处理上千万条记录的大型数据库,本文介绍MySql9.1.0安装详细教程,... 目录mysql介绍:一、下载 Mysql 安装文件二、Mysql 安装教程三、环境配置1.右击此电脑