一个基于更新频率和卡片等级、浏览量的动态推荐排序算法

2024-04-23 17:04

本文主要是介绍一个基于更新频率和卡片等级、浏览量的动态推荐排序算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

需求背景

真实场景会更复杂一些,下面抽象出一个简单的示例来举栗子:
比如现在有一个卡片列表,卡片自身有卡片的创建时间卡片等级浏览量几个关键字段。
如果单纯的根据卡片等级去排序,那么很容易导致一些高等级的旧卡片一直霸榜;
按照创建时间去排的话,前面就容易出现一些粗制滥造的卡片;
所以单纯按照某一个字段去排序,效果都不会太好,没办法达成一个动态推荐的目的;
我们最直观的想法就是把这几个因素综合起来,给他们不同的权重,去达到一个综合的排序效果。

数据分析

简单来说,就是希望不同的等级有不同的权重,不同的创建时间有不同的权重,不同的浏览量亦如此,且这些"权重"最后是可以一起算出一个排序参数的。
举个例子,比如首先我们定义的卡片等级分为S A B C D E。
然后需要分析现有的数据分布和一个增长指数。
比如我们可以分析出以下几个指标:

  • 等级增长频率:S、A每年[80-200],每个季度平均有20±,每个季度至少有5个,过去的曲线是线性增长的,随着团队规模和业务比重的增大,预计趋势会保持且增长率会提升
    B每年400左右,每个季度平均有100,至少有40,且都是随着时间上升的
    得出结论,S、A的优质卡片和B的高品级卡片可以占据更大的推荐权重指数
    目前的页大小:60
    目前的浏览量:最多的是几百,平均几十

算法效果预期

  1. 首页都是高质量卡片(尽量都是S、A,最次为B,CDE尽量不出现在前几页)
  2. 前几页的卡片以一定的频率更新,等级越高的卡片,曝光周期和被顶替难度越大,相反则越小;这个顶替程度根据卡片等级的不同,也会有所不同,比如S和A的卡片量较少,所以理论情况下1-2个月内不会被其他等级的卡片更新所覆盖;B的卡片数量较多一些,2个月后逐步开始覆盖2月前的S、A;至于CDE则在B的基础上再顺推3个月左右才会有顶替的可能(除非半年多没有B级别以上的卡片入库,理论上不可能);
  3. 在这个过程中,排序也会受到卡片浏览量一定的影响,但是权重相对少一些,只有达到几百这个数量才会有明显的影响;由于页面上暂时没有展示浏览量的地方,一些特殊情况下可通过指定浏览量来达到个别卡片顺序灵活调整的目的,如置顶等;

算法参数拟定

综合卡片的等级占比、数量、更新频率和增长趋势,不建议采用固定日期的推荐方式,采用更灵活的属性权重方式来推荐卡片
以当前各等级的更新频率、数量、每页的卡片数以及预期达到的效果,初步拟定的指数排布对比表格如下:

统一备用基数示例日期基数周期指数等级步长推荐指数
S1001000276476
A10010010266476
B10010050216476
C100100164112476
D100100174102476
E10010018492476

另外,目前额外加入了浏览量作为一个权重较小的比较参数,根据目前的浏览量的量级和分布,取的模暂时定为20,体现的效果为,卡片等级相同、更新时间相近的两个卡片,浏览量较多的卡片排序可能会更靠前。

举个例子,若不考虑浏览量的话,上面的S级卡片发布后,再过184天,一个E级的卡片才能和它的推荐指数一样。
同理,S级卡片发布10天内,低等级的卡片是无法取代的,10天后,A级卡片就可以超过它。
先上代码,再说解析

代码

public Long getRecommendNum(Long lookNum) throws ParseException {SimpleDateFormat dateFormat = new SimpleDateFormat(DatePattern.NORM_DATE_PATTERN);Date startDate = dateFormat.parse("2021-10-01");if (publishTime == null || grade == null) {return 0L;}// 季度方式// int quarter = new BigDecimal(DateUtil.between(startDate, publishTime, DateUnit.DAY)).divide(new BigDecimal("91.25"), 0, RoundingMode.CEILING).intValue();// 自然天方式int afterDay = new BigDecimal(DateUtil.between(startDate, publishTime, DateUnit.DAY)).setScale(0, RoundingMode.CEILING).intValue();Integer gradeStep = GRADE_RECOMMEND_STEP_MAP.get(grade);long l1 = 100 + afterDay + gradeStep + lookNum / 20;return l1;}
public static LinkedHashMap<String, Integer> GRADE_RECOMMEND_STEP_MAP = new LinkedHashMap<String, Integer>(8) {{put(ASSETS_GRADE_S, 276);put(ASSETS_GRADE_A, 266);put(ASSETS_GRADE_B, 216);put(ASSETS_GRADE_C, 112);put(ASSETS_GRADE_D, 102);put(ASSETS_GRADE_E, 92);}};

总结

可以看到这个算法本身的逻辑并不难,它的难点在于如何分析出合理的参数,要基于当前系统的数据情况,未来业务的发展预期和想要达到的推荐效果,来得到算法的参数。

这篇关于一个基于更新频率和卡片等级、浏览量的动态推荐排序算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/929378

相关文章

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

第10章 中断和动态时钟显示

第10章 中断和动态时钟显示 从本章开始,按照书籍的划分,第10章开始就进入保护模式(Protected Mode)部分了,感觉从这里开始难度突然就增加了。 书中介绍了为什么有中断(Interrupt)的设计,中断的几种方式:外部硬件中断、内部中断和软中断。通过中断做了一个会走的时钟和屏幕上输入字符的程序。 我自己理解中断的一些作用: 为了更好的利用处理器的性能。协同快速和慢速设备一起工作

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

poj3468(线段树成段更新模板题)

题意:包括两个操作:1、将[a.b]上的数字加上v;2、查询区间[a,b]上的和 下面的介绍是下解题思路: 首先介绍  lazy-tag思想:用一个变量记录每一个线段树节点的变化值,当这部分线段的一致性被破坏我们就将这个变化值传递给子区间,大大增加了线段树的效率。 比如现在需要对[a,b]区间值进行加c操作,那么就从根节点[1,n]开始调用update函数进行操作,如果刚好执行到一个子节点,

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

hdu1689(线段树成段更新)

两种操作:1、set区间[a,b]上数字为v;2、查询[ 1 , n ]上的sum 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#include<queue>#include<set>#include<map>#include<stdio.h>#include<stdl

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig