2.app recommendation with very sparse datasets

2024-03-16 14:58

本文主要是介绍2.app recommendation with very sparse datasets,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.摘要

app的使用曲线呈现很高的峰态和更显著的长尾现象。即,少数最受欢迎的的app享有很高的下载量,绝大多数app所占份额极少,甚至屈指可数,具有很大的稀疏性。

主要原因有:与电影等商品相比,app开发者使用的资源具有很大的多样性且发布app的开支更小。

对稀疏集的处理,可提高降维的使用。


2.我的想法

现有的app商店多数使用以下三种方法提供app:(1)最受欢迎的app列表(2)几大类别分类呈现(3)关键字搜索。

存在问题:(1)极少数app因受欢迎而更受欢迎,埋没新生高质量app市场;(2)类别分类太粗糙,通常一个类别下包含超多条目;(3)用户并不知道要搜索什么。搜索的通常是标题。


3.结论

传统基于记忆的算法(memory-based)对少数受欢迎的app更有利,会造成更严重的峰态;
隐语义模型(latent factor model)更适合对电影等商品的处理,对稀疏集的处理准确性不足;
本文所提出的eigenapp model 对于具有稀疏性的长尾app具有优越的推荐效果。


4.数据处理

(1)数据集
使用GetJar上2011年11月7日-11月21日,101106个用户,55020个app的记录。

(2)数据预处理。
峰态和长尾现象明显,定义最受欢迎的100个app作为头部。可能存在同一app功能类似,多次发布。数据集中清除不足20个用户的app数据。

(3)衡量指标设置。
选取使用的天数作为衡量指标。因为对app的评分受上下文影响较大,而且,对于不同类别app,使用的多不一定评分高。
为了说明更合理,采取两种评测系统:1)使用的天数;2)使用和未使用二值。

5.模型设计

(1)非个性化模型
根据受欢迎度进行排序,受欢迎度通过用户数衡量。

(2)基于记忆的模型
通过对数据的分析发现超过90%的app对只有一个或没有共同用户。由于皮尔逊相关系数(Pearson correlation coefficient)需要大量共同用户,所以选择余弦相似度。
用R表示m*n用户-app矩阵,根据 计算得item-item相似度矩阵S,可想而知S较为稀疏。考虑用 计算亲密度,I_u表示用户u使用的app集合,根据亲密度评分来生成top-N列表。发现用Z评分对S_i,j进行正规化后效果更好, 。同时能减少噪声。

(3)隐语义模型
对于之前构建的R矩阵,利用PureSVD进行因子分解。PureSVD不盲目追求RMSE(均方根误差)最优,而是根据相关评分相对排序(什么鬼?)。

(4)特征app模型(eigenapp model)
对矩阵R的item向量进行正规化,防止倾向于热门app。采用PCA(主成分分析)提取特征。
各种投影,转置提取出较好的特征。


6.评测

评测指标:准确度;长尾app的准确度;流行度;多样性。

这篇关于2.app recommendation with very sparse datasets的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/815828

相关文章

macOS怎么轻松更换App图标? Mac电脑图标更换指南

《macOS怎么轻松更换App图标?Mac电脑图标更换指南》想要给你的Mac电脑按照自己的喜好来更换App图标?其实非常简单,只需要两步就能搞定,下面我来详细讲解一下... 虽然 MACOS 的个性化定制选项已经「缩水」,不如早期版本那么丰富,www.chinasem.cn但我们仍然可以按照自己的喜好来更换

React实现原生APP切换效果

《React实现原生APP切换效果》最近需要使用Hybrid的方式开发一个APP,交互和原生APP相似并且需要IM通信,本文给大家介绍了使用React实现原生APP切换效果,文中通过代码示例讲解的非常... 目录背景需求概览技术栈实现步骤根据 react-router-dom 文档配置好路由添加过渡动画使用

MFC中App,Doc,MainFrame,View各指针的互相获取

纸上得来终觉浅,为了熟悉获取方法,我建了个SDI。 首先说明这四个类的执行顺序是App->Doc->Main->View 另外添加CDialog类获得各个指针的方法。 多文档的获取有点小区别,有时间也总结一下。 //  App void CSDIApp::OnApp() {      //  App      //  Doc     CDocument *pD

ConstraintLayout布局里的一个属性app:layout_constraintDimensionRatio

ConstraintLayout 这是一个约束布局,可以尽可能的减少布局的嵌套。有一个属性特别好用,可以用来动态限制宽或者高app:layout_constraintDimensionRatio 关于app:layout_constraintDimensionRatio参数 app:layout_constraintDimensionRatio=“h,1:1” 表示高度height是动态变化

App Store最低版本要求汇总

1,自此日期起: 2024 年 4 月 29 日 自 2024 年 4 月 29 日起,上传到 App Store Connect 的 App 必须是使用 Xcode 15 为 iOS 17、iPadOS 17、Apple tvOS 17 或 watchOS 10 构建的 App。将 iOS App 提交至 App Store - Apple Developer 2,最低XCode版本 Xcod

鸿蒙自动化发布测试版本app

创建API客户端 API客户端是AppGallery Connect用于管理用户访问AppGallery Connect API的身份凭据,您可以给不同角色创建不同的API客户端,使不同角色可以访问对应权限的AppGallery Connect API。在访问某个API前,必须创建有权访问该API的API客户端。 1.登录AppGallery Connect网站,选择“用户与访问”。选择左侧

Xinstall助力App全渠道统计,参数传递下载提升用户体验!

在移动互联网时代,App已成为我们日常生活中不可或缺的一部分。然而,对于App开发者来说,如何有效地推广和运营自己的应用,却是一个不小的挑战。尤其是在面对众多渠道、复杂的数据统计和用户需求多样化的情况下,如何精准地触达目标用户,提升用户的下载、安装和活跃度,更是考验着每一个运营者的智慧。 今天,我们就来揭秘一个能够帮助App开发者解决这些痛点的神器——Xinstall。作为一家一站式App全渠道

Flask 创建app 时候传入的 static_folder 和 static_url_path参数理解

Flask 在创建app的时候 是用 app = Flask(__name__) 来创建的,不传入 static_folder参数的话 ,默认的静态文件的位置是在 static目录下 我们可以进入 Flask的源码里面查看 ctrl+鼠标左键进入 这是Flask的 __init__源码(后面还有一些,我就选了需要的代码)     def __init__(self,import_

Terminating app due to uncaught exception 'NSInternalInconsistencyException', reason: '-[__NSCFArra

这个错误说的是一个不可变数组负值给了一个可变的数组。有可能你前面定义的数组是一个可变数组,但是在你其他方法里面用他的时候,他就是一个不可变数组,因为在可变数组拿到别的地方用的时候,他会默认为不可变的,可能这只是一个类里面你只是简单的声明了他吧,并没有进行对他初始化,或者分配什么内存,所以他只是一个不可变的数组,当你在其他地方用他的时候,他就默认为不可变的数组,他可能因为你的没分配内存,而变回不可变

app提交到腾讯开发平台,提示无法获取签名信息,请上传有效包(110506)

最近提交APP时遇到的,一般情况下是因为打包时至勾选v2没有勾选v1的原因,如下图: 这个时候将v1勾选即可。 但是在打包时ˉv1和v2都勾选了也可能会出现这个报错,那就要看一下gradle的 minSdkVersion,如果这个版本在24-26之间也可能会提示这个错误,所以降低这个版本就可以了