本文主要是介绍【推荐架构day6】Instagram推荐算法的基本原理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
每个月,超过一半的 Instagram 社区成员都会访问 Instagram Explore 页面,寻找他们感兴趣的新照片、视频和故事。在数以亿计的选项中,如何大规模实时推荐与用户最相关的内容,给 Instagram 的工程师带来了许多挑战,这些挑战需要新的工程解决方案。
Instagram 通过创建一系列自定义查询语言、轻量级建模技术和支持高速实验的工具来解决这些挑战。这些系统支持 Explore 页面的规模,同时也提高了开发人员的效率。总的来说,这些解决方案描述了一种高效的人工智能系统,该系统基于一个高效的三阶段排名漏斗(3-part ranking funnel),它能提取 650 亿个特征,每秒进行 9000 万个模型预测。
本文,我们分享了让 Explore 页面起作用的关键要素的第一次详细概述,以及我们在 Instagram 上如何为人们提供个性化内容。
开发 Explore 页面的基础构件
在着手构建一个推荐引擎来处理每天上传到 Instagram 上的大量照片和视频之前,我们开发了一些基础工具来解决三个重要需求。我们需要进行大规模快速实验的能力,需要在人们兴趣范围内捕获更强的信号,需要一种计算效率高的方式来确保我们的建议既高质量又新鲜,这些定制技术是实现我们目标的关键。
使用 IGQL 快速迭代:一种新的特定领域语言
构建最佳推荐算法和技术是机器学习社区的研究领域之一,并且,根据任务的不同,选择合适的系统的过程也会有很大的不同。例如,虽然一种算法可以有效地识别长期兴趣,但另一种算法在识别基于最近内容的推荐方面可能表现得更好。我们的工程团队使用不同的方法进行迭代,我们需要一种方法,既能有效地尝试新的想法,又能将有前途的想法轻松地应用到大规模系统中,而不必太过担心计算资源的影响,如 CPU 和内存的使用。
为了解决这个问题,我们创建并发布了 IGQL,这是一种针对推荐系统中检索候选对象进行优化的特定领域语言。它的执行是在 C++ 中优化的,这有助于最小化延迟和计算资源。在测试新的研究想法时,还具有可扩展性和易用性。IGQL 既是静态验证,也是高级语言。工程师可以像 Python 那样编写推荐算法,并在 C++ 中快速高效地执行。
user
.let(seed_id=user_id)
.liked(max_num_to_retrieve=30)
.account_nn(embedding_config=default)
.posted_media(max_media_per_account=10)
.filter(non_recommendable_model_threshold=0.2)
.rank(ranking_model=default)
.diversify_by(seed_id, method=round_robin)
从上面的代码示例中可以看到ÿ
这篇关于【推荐架构day6】Instagram推荐算法的基本原理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!