DeepMind改进的Google Play Store推荐系统要点解析

2024-06-21 09:08

本文主要是介绍DeepMind改进的Google Play Store推荐系统要点解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”


作者:Michelle Gong, Anton Zhernov

编译:ronghuaiyang

导读

DeepMind和Google Play合作,推动了 Play Store 的发现系统的重大改进,为用户提供更加个性化和直观的 Play Store 体验。

在过去的几年中,我们把 DeepMind 的技术应用到了谷歌产品和基础设施中,取得了巨大的成功,我们使用数据中心冷却技术减少了大量的能耗,并扩展了 Android 的电池性能。我们很高兴能与大家分享我们接下来的几个月里的工作

我们与 Google Play 商店的合作

我们知道,当用户拥有他们喜爱的应用程序和游戏时,他们就能最大限度地利用他们的手机,发现新的最爱是一件令人兴奋的事情。在与 Google Play 的合作中,我们的团队领导了与谷歌的合作,推动了 Play Store 的发现系统的重大改进,为用户提供更加个性化和直观的 Play Store 体验。

每个月,有数十亿的用户来 Google Play Store 为他们的移动设备下载应用程序,Play Store 支持了世界上最大的推荐系统之一。一些人在寻找特定的应用程序,比如 Snapchat,而另一些人在浏览商店,想看看有什么新东西和有趣的东西。Google Play 的发现团队努力帮助用户发现最相关的应用程序和游戏,为他们提供有用的应用程序推荐。为了提供更丰富、个性化的体验,应用程序会根据用户过去的偏好来推荐。然而,这需要非常细致的进行区分 — 既要理解应用程序的功能,也要了解它与特定用户的相关性。例如,对于一个狂热的科幻游戏玩家来说,类似的游戏推荐可能会很有趣,但如果用户安装了一个旅游应用,推荐一个翻译应用可能比另外五个旅游应用更相关。这些用户首选项的收集和使用由谷歌的隐私政策管理。

我们开始与 Play store 合作,帮助开发和改进系统,以确定应用程序与用户的相关性。在这篇文章中,我们将探索一些我们为实现这一目标而开发的尖端机器学习技术。今天,Google Play 的推荐系统包含三个主要模型:一个候选生成器、一个重排序机和一个针对多个目标进行优化的模型。候选生成器是一个深度检索模型,可以分析 100 多万个应用程序并检索最合适的应用程序。对于每个应用程序,重排序机(即用户偏好模型)会从多个维度预测用户的偏好。接下来,这些预测是多目标优化模型的输入,该模型的解决方案为用户提供最合适的候选方案。

在现实世界的约束下应用机器学习

改善 Google Play 的推荐系统学习用户的喜好,我们的第一种方法是使用一个 LSTM(长短期记忆)模型,这是一个在现实场景中表现很好的递归神经网络,因为它具有由于强大的更新和反向传播动能力。虽然 LSTM 带来了显著的精度提高,但它也引入了服务延迟,因为 LSTM 在处理长序列时可能在计算上非常昂贵。为了解决这个问题,我们将 LSTM 替换为一个 Transformer 模型,它可以很好地进行序列到序列的预测,并且之前在自然语言处理方面取得了很好的结果,因为它能够比其他常用的模型捕获单词之间更长的依赖关系。该 Transformer 在提高模型性能的同时,也增加了训练成本。我们的第三个也是最后一个解决方案是实现一个有效的加法注意力模型,该模型适用于序列特征的任何组合,同时具有较低的计算成本。

候选生成器去偏差

我们的模型(称为候选生成器)根据用户从 Play store 中安装的以前的应用程序来判断他们更可能安装哪些应用程序。然而,这可能会引入推荐偏差问题。例如,如果 app A 在 Play store 中显示的次数是 app B 的 10 倍,那么用户就更有可能安装它,因此我们的模型也更有可能推荐它。因此,该模型学会了一种偏差,即越是频繁显示的 app,安装的越多。

为了帮助纠正这种偏差,我们在模型中引入了重要性加权。这个重要性权重是基于每一个独立应用的打开—安装率与整个 Play store 的打开—安装率的中间值。安装率低于中值的应用程序的重要性权重将小于 1。然而,如果安装率高于中位数,即使是安装频率较低的“小众”应用程序也可能具有较高的重要性。通过重要性加权,我们的候选生成器可以根据安装率降低或提高应用程序的权重,从而缓解推荐偏差问题。

重排序推荐的改进

推荐系统通常为用户提供一系列的可能性,并以最佳或最相关的选项的顺序显示在顶部。但我们如何确保最相关的应用程序出现在列表的顶部,这样用户就不必滚动页面,或可能错过最佳选项?许多推荐系统将排名问题视为一个二元分类问题,其中训练数据要么被标记为正类,要么被标记为负类,排名者仅从这个二元标签就学会了预测概率。然而,这种“pointwise”模型,一次只对一项进行排名,不能捕捉到应用程序相和其他应用程序相关性的上下文。为了提供更好的用户体验,排名者可以根据其他候选应用程序的上下文来预测呈现项的相对顺序。

我们的解决方案,reranker 模型,学习了同时显示给用户的一对应用程序的相关重要性。我们的 reranker 模型基于一个核心观点:如果用户在商店中同时看到两个应用程序,那么用户选择安装的应用程序比他们没有安装的应用程序更贴近用户。然后,我们可以为每一对应用程序分配一个正样本或负样本的标签,而该模型试图最小化排名中的逆序数量,从而提高应用程序的相对排名。这种“pairwise”模型在实践中比 pointwise 模型更有效,因为预测相对顺序比预测类标签或安装概率更接近于排序的本质。

优化多个目标

许多推荐系统必须同时针对多个目标进行优化,比如相关性、受欢迎程度或个人偏好。我们将多目标优化问题表述为一个约束优化问题:总体目标是最大化主要度量的期望值,受次要度量期望值的约束。在在线服务期间,目标可能会根据用户的需求而改变。例如,一个用户以前对住房搜索应用程序感兴趣,现在可能已经找到了一个新的公寓,所以现在对家居装饰应用程序感兴趣。所以我们致力于一个动态的解决方案。

我们不是离线解决问题,然后把固定的模型部署上线,而是根据服务期间目标的实际价值,根据每个请求在线解决问题。我们将约束定义为相对约束,这意味着我们希望将次要目标提高一个百分比,而不是一个绝对值。这样,次要目标的任何变化都不会影响我们的求解。

我们开发的算法可以用来发现许多度量之间的权衡。在权衡曲线上找到合适的点,我们的算法可以显著提高次要度量,而对主要度量的影响很小。

团队合作

我们从这次合作中得出的一个重要结论是,在实现用于现实世界的高级机器学习技术时,我们需要在许多实际的约束条件下工作。因为 Play Store 和 DeepMind 团队紧密合作,每天都进行沟通,所以我们能够在算法设计、实现和最终测试阶段考虑到产品需求和约束,从而获得更成功的产品。

迄今为止,我们与谷歌的合作通过冷却谷歌的数据中心,减少了 30%的所需的电力,提高了谷歌的风能价值约 20%,并创建了设备上的学习系统来优化 Android 电池性能。现在谷歌助理和谷歌云平台用户遍布世界各地,我们和 Waymo 的合作研究帮助提高其模型性能,以及提高训练神经网络的效率。

—END—

英文原文:https://deepmind.com/blog/article/Advanced-machine-learning-helps-Play-Store-users-discover-personalised-apps

请长按或扫描二维码关注本公众号

喜欢的话,请给我个好看吧

这篇关于DeepMind改进的Google Play Store推荐系统要点解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1080790

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

软考系统规划与管理师考试证书含金量高吗?

2024年软考系统规划与管理师考试报名时间节点: 报名时间:2024年上半年软考将于3月中旬陆续开始报名 考试时间:上半年5月25日到28日,下半年11月9日到12日 分数线:所有科目成绩均须达到45分以上(包括45分)方可通过考试 成绩查询:可在“中国计算机技术职业资格网”上查询软考成绩 出成绩时间:预计在11月左右 证书领取时间:一般在考试成绩公布后3~4个月,各地领取时间有所不同