大数据、数据架构、推荐冷启动...小红书的 AI 数据新方案都在这个会

2024-04-16 19:52

本文主要是介绍大数据、数据架构、推荐冷启动...小红书的 AI 数据新方案都在这个会,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

伴随着行业数据持续积累,人工智能正加速渗透各类场景,大数据、数据架构和推荐系统等领域,依然是各行各业目之所聚。4 月 19  至 20 日,「DataFunCon 2024 · 上海站」来袭!大会以“数聚垂域,智领未来”为主题,将在上海龙之梦大酒店举行。

小红书技术副总裁风笛出任大会专家团,携手上海市数据科学重点实验室,以及阿里巴巴、百度、京东等多家行业领军代表,共同策划 60 余场精彩议题,深入探讨“ 大数据 + AI ”在各个行业中的落地应用。

小红书存储和数据库团队负责人刘备(毛琦),担任「数智 · 大数据系统论坛」工业出品人,与来自抖音、清华大学、复旦大学、哈尔滨工业大学等多位数据智能技术专家,畅聊大数据系统探索的最新实践。

  • 实时湖仓如何保证数据质量的同时,实现低延迟数据处理?

  • 在缺乏用户历史数据情况下,推荐系统如何有效地为新内容找到目标受众?

  • 如何提升图数据库的多跳查询性能,满足在线业务的实时性要求?

这类问题不仅推动着技术创新探索,也激发了我们对技术落地的无限想象力。

4 月 19 日起,小红书技术团队将接连贡献三个精彩议题,解答上述问题。小红书数据引擎湖仓架构团队负责人庞博、社区推荐算法专家巴斯、分布式数据库架构师再兴将在峰会现场带来实时湖仓架构在小红书的探索与实践、《高时效推荐实践 - 从系统提效到内容冷启动》和《小红书图数据库在分布式并行查询上的探索》的主题分享。

分享日程

4 月 19 日 17:20-18:05「新一代数据架构论坛」

庞博(孙超) |   小红书数据引擎湖仓架构负责人

在数据驱动时代,实时湖仓架构正成为企业快速响应市场变化、提升决策效率的关键。庞博拥有丰富的数据平台架构设计与优化经验,在本次分享他将带领我们深入探讨:小红书如何结合线上业务场景和需求,通过 OLAP 和数据湖技术的深度融合,实现架构的优化升级。

庞博将详细阐述小红书湖仓架构的演进历程,并围绕“产出更快”“查询更快”这两个核心需求,分享小红书实时湖仓架构的创新策略和成果。通过一系列实际案例分析,他将展示如何运用近实时入湖、StarRocks、Iceberg 等前沿技术,有效降低数据处理成本,提升查询性能和效率。

4 月 19 日 17:20-18:05「推荐系统论坛」

巴斯(陈祈烨) |   小红书社区推荐算法专家

小红书如何打造一个分钟级的高时效推荐系统,快速满足用户的个性化需求?内容冷启动作为推荐系统的核心环节,对于新内容的传播和用户参与度的提升至关重要。本次分享,巴斯将深入剖析高时效推荐系统的构建过程和内容冷启动的关键策略。

巴斯在视频推荐、内容冷启动及社交推荐等领域拥有多年实战经验。他将分享小红书去中心化高时效分发系统的实践和挑战,从推荐时效性提升开始,延伸至内容冷启动的多项探索和技术实践。通过实际案例分析,巴斯将揭示如何利用创新算法和策略,解决新内容在缺乏历史数据和用户反馈情况下的推荐难题。

4 月 20 日 16:35-17:20 「数智 · 大数据系统论坛」

再兴(李凝瑞) |   小红书分布式数据库架构师 

图数据库作为数据库领域的重要分支,虽然经过数十年发展并涌现出众多产品,但在互联网公司的在线业务应用中,其查询能力的使用却往往局限于两跳以内。这主要是因为传统数据库在三跳及以上的查询时延过长,无法满足在线业务对实时性的高要求。

小红书数据库团队通过分析原查询模式上的弊端,并提出优化点,将分布式并行查询的思想应用于图数据库,显著提升多跳查询的响应时间。再兴,作为 Apache 社区开源项目 HugeGraph 的核心创始人、小红书图数据库产品 REDgraph 核心成员,将在本次分享中详细介绍这一技术探索。

在本次分享中,再兴将从图数据的基本概念讲起,深入探讨多跳查询在业务中的应用和面临的性能挑战。他将阐述团队如何识别并优化原查询模式,以及为什么选择分布式并行查询作为突破口。通过介绍基于 MPP 理念的技术实践,包括架构改造、查询计划改写、起点 ID 去重等优化措施,再兴将揭示这些创新如何实现查询性能的显著提升。

图片

限时赠票

想想要亲临上海峰会现场,一览数据智能的探索实践?

我们将免费送出门票一张

转发推送至朋友圈,后台回复「DataFun」,即可参与抽奖。

我们将抽取 1 位幸运的小伙伴

获得 DataFunCon 2024·上海站门票(不含餐)。
 

抽奖截止时间:4 月 18 日  12:00


温馨提示:

中奖者请在 6 个小时内留意消息,添加小助手微信【微信号:REDtech01】,凭中奖信息和转发截图领取电子门票。

这篇关于大数据、数据架构、推荐冷启动...小红书的 AI 数据新方案都在这个会的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/909745

相关文章

Spring AI集成DeepSeek的详细步骤

《SpringAI集成DeepSeek的详细步骤》DeepSeek作为一款卓越的国产AI模型,越来越多的公司考虑在自己的应用中集成,对于Java应用来说,我们可以借助SpringAI集成DeepSe... 目录DeepSeek 介绍Spring AI 是什么?1、环境准备2、构建项目2.1、pom依赖2.2

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

Redis的数据过期策略和数据淘汰策略

《Redis的数据过期策略和数据淘汰策略》本文主要介绍了Redis的数据过期策略和数据淘汰策略,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录一、数据过期策略1、惰性删除2、定期删除二、数据淘汰策略1、数据淘汰策略概念2、8种数据淘汰策略

轻松上手MYSQL之JSON函数实现高效数据查询与操作

《轻松上手MYSQL之JSON函数实现高效数据查询与操作》:本文主要介绍轻松上手MYSQL之JSON函数实现高效数据查询与操作的相关资料,MySQL提供了多个JSON函数,用于处理和查询JSON数... 目录一、jsON_EXTRACT 提取指定数据二、JSON_UNQUOTE 取消双引号三、JSON_KE

Python给Excel写入数据的四种方法小结

《Python给Excel写入数据的四种方法小结》本文主要介绍了Python给Excel写入数据的四种方法小结,包含openpyxl库、xlsxwriter库、pandas库和win32com库,具有... 目录1. 使用 openpyxl 库2. 使用 xlsxwriter 库3. 使用 pandas 库

SpringBoot定制JSON响应数据的实现

《SpringBoot定制JSON响应数据的实现》本文主要介绍了SpringBoot定制JSON响应数据的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们... 目录前言一、如何使用@jsonView这个注解?二、应用场景三、实战案例注解方式编程方式总结 前言

SpringBoot整合DeepSeek实现AI对话功能

《SpringBoot整合DeepSeek实现AI对话功能》本文介绍了如何在SpringBoot项目中整合DeepSeekAPI和本地私有化部署DeepSeekR1模型,通过SpringAI框架简化了... 目录Spring AI版本依赖整合DeepSeek API key整合本地化部署的DeepSeek

使用Python在Excel中创建和取消数据分组

《使用Python在Excel中创建和取消数据分组》Excel中的分组是一种通过添加层级结构将相邻行或列组织在一起的功能,当分组完成后,用户可以通过折叠或展开数据组来简化数据视图,这篇博客将介绍如何使... 目录引言使用工具python在Excel中创建行和列分组Python在Excel中创建嵌套分组Pyt

MySQL 缓存机制与架构解析(最新推荐)

《MySQL缓存机制与架构解析(最新推荐)》本文详细介绍了MySQL的缓存机制和整体架构,包括一级缓存(InnoDBBufferPool)和二级缓存(QueryCache),文章还探讨了SQL... 目录一、mysql缓存机制概述二、MySQL整体架构三、SQL查询执行全流程四、MySQL 8.0为何移除查