大数据、数据架构、推荐冷启动...小红书的 AI 数据新方案都在这个会

2024-04-16 19:52

本文主要是介绍大数据、数据架构、推荐冷启动...小红书的 AI 数据新方案都在这个会,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

伴随着行业数据持续积累,人工智能正加速渗透各类场景,大数据、数据架构和推荐系统等领域,依然是各行各业目之所聚。4 月 19  至 20 日,「DataFunCon 2024 · 上海站」来袭!大会以“数聚垂域,智领未来”为主题,将在上海龙之梦大酒店举行。

小红书技术副总裁风笛出任大会专家团,携手上海市数据科学重点实验室,以及阿里巴巴、百度、京东等多家行业领军代表,共同策划 60 余场精彩议题,深入探讨“ 大数据 + AI ”在各个行业中的落地应用。

小红书存储和数据库团队负责人刘备(毛琦),担任「数智 · 大数据系统论坛」工业出品人,与来自抖音、清华大学、复旦大学、哈尔滨工业大学等多位数据智能技术专家,畅聊大数据系统探索的最新实践。

  • 实时湖仓如何保证数据质量的同时,实现低延迟数据处理?

  • 在缺乏用户历史数据情况下,推荐系统如何有效地为新内容找到目标受众?

  • 如何提升图数据库的多跳查询性能,满足在线业务的实时性要求?

这类问题不仅推动着技术创新探索,也激发了我们对技术落地的无限想象力。

4 月 19 日起,小红书技术团队将接连贡献三个精彩议题,解答上述问题。小红书数据引擎湖仓架构团队负责人庞博、社区推荐算法专家巴斯、分布式数据库架构师再兴将在峰会现场带来实时湖仓架构在小红书的探索与实践、《高时效推荐实践 - 从系统提效到内容冷启动》和《小红书图数据库在分布式并行查询上的探索》的主题分享。

分享日程

4 月 19 日 17:20-18:05「新一代数据架构论坛」

庞博(孙超) |   小红书数据引擎湖仓架构负责人

在数据驱动时代,实时湖仓架构正成为企业快速响应市场变化、提升决策效率的关键。庞博拥有丰富的数据平台架构设计与优化经验,在本次分享他将带领我们深入探讨:小红书如何结合线上业务场景和需求,通过 OLAP 和数据湖技术的深度融合,实现架构的优化升级。

庞博将详细阐述小红书湖仓架构的演进历程,并围绕“产出更快”“查询更快”这两个核心需求,分享小红书实时湖仓架构的创新策略和成果。通过一系列实际案例分析,他将展示如何运用近实时入湖、StarRocks、Iceberg 等前沿技术,有效降低数据处理成本,提升查询性能和效率。

4 月 19 日 17:20-18:05「推荐系统论坛」

巴斯(陈祈烨) |   小红书社区推荐算法专家

小红书如何打造一个分钟级的高时效推荐系统,快速满足用户的个性化需求?内容冷启动作为推荐系统的核心环节,对于新内容的传播和用户参与度的提升至关重要。本次分享,巴斯将深入剖析高时效推荐系统的构建过程和内容冷启动的关键策略。

巴斯在视频推荐、内容冷启动及社交推荐等领域拥有多年实战经验。他将分享小红书去中心化高时效分发系统的实践和挑战,从推荐时效性提升开始,延伸至内容冷启动的多项探索和技术实践。通过实际案例分析,巴斯将揭示如何利用创新算法和策略,解决新内容在缺乏历史数据和用户反馈情况下的推荐难题。

4 月 20 日 16:35-17:20 「数智 · 大数据系统论坛」

再兴(李凝瑞) |   小红书分布式数据库架构师 

图数据库作为数据库领域的重要分支,虽然经过数十年发展并涌现出众多产品,但在互联网公司的在线业务应用中,其查询能力的使用却往往局限于两跳以内。这主要是因为传统数据库在三跳及以上的查询时延过长,无法满足在线业务对实时性的高要求。

小红书数据库团队通过分析原查询模式上的弊端,并提出优化点,将分布式并行查询的思想应用于图数据库,显著提升多跳查询的响应时间。再兴,作为 Apache 社区开源项目 HugeGraph 的核心创始人、小红书图数据库产品 REDgraph 核心成员,将在本次分享中详细介绍这一技术探索。

在本次分享中,再兴将从图数据的基本概念讲起,深入探讨多跳查询在业务中的应用和面临的性能挑战。他将阐述团队如何识别并优化原查询模式,以及为什么选择分布式并行查询作为突破口。通过介绍基于 MPP 理念的技术实践,包括架构改造、查询计划改写、起点 ID 去重等优化措施,再兴将揭示这些创新如何实现查询性能的显著提升。

图片

限时赠票

想想要亲临上海峰会现场,一览数据智能的探索实践?

我们将免费送出门票一张

转发推送至朋友圈,后台回复「DataFun」,即可参与抽奖。

我们将抽取 1 位幸运的小伙伴

获得 DataFunCon 2024·上海站门票(不含餐)。
 

抽奖截止时间:4 月 18 日  12:00


温馨提示:

中奖者请在 6 个小时内留意消息,添加小助手微信【微信号:REDtech01】,凭中奖信息和转发截图领取电子门票。

这篇关于大数据、数据架构、推荐冷启动...小红书的 AI 数据新方案都在这个会的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/909745

相关文章

Spring Boot + MyBatis Plus 高效开发实战从入门到进阶优化(推荐)

《SpringBoot+MyBatisPlus高效开发实战从入门到进阶优化(推荐)》本文将详细介绍SpringBoot+MyBatisPlus的完整开发流程,并深入剖析分页查询、批量操作、动... 目录Spring Boot + MyBATis Plus 高效开发实战:从入门到进阶优化1. MyBatis

Java进行文件格式校验的方案详解

《Java进行文件格式校验的方案详解》这篇文章主要为大家详细介绍了Java中进行文件格式校验的相关方案,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、背景异常现象原因排查用户的无心之过二、解决方案Magandroidic Number判断主流检测库对比Tika的使用区分zip

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

MySQL大表数据的分区与分库分表的实现

《MySQL大表数据的分区与分库分表的实现》数据库的分区和分库分表是两种常用的技术方案,本文主要介绍了MySQL大表数据的分区与分库分表的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. mysql大表数据的分区1.1 什么是分区?1.2 分区的类型1.3 分区的优点1.4 分

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

Java异常架构Exception(异常)详解

《Java异常架构Exception(异常)详解》:本文主要介绍Java异常架构Exception(异常),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1. Exception 类的概述Exception的分类2. 受检异常(Checked Exception)

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Redis 中的热点键和数据倾斜示例详解

《Redis中的热点键和数据倾斜示例详解》热点键是指在Redis中被频繁访问的特定键,这些键由于其高访问频率,可能导致Redis服务器的性能问题,尤其是在高并发场景下,本文给大家介绍Redis中的热... 目录Redis 中的热点键和数据倾斜热点键(Hot Key)定义特点应对策略示例数据倾斜(Data S

Python实现将MySQL中所有表的数据都导出为CSV文件并压缩

《Python实现将MySQL中所有表的数据都导出为CSV文件并压缩》这篇文章主要为大家详细介绍了如何使用Python将MySQL数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到... python将mysql数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到另一个