Unstructured Data Meetup 南京场收官!干货指南:大模型、向量数据库和 RAG

本文主要是介绍Unstructured Data Meetup 南京场收官!干货指南:大模型、向量数据库和 RAG,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

a81ce3849c5f8d49c6cabb811ed9065d.png

近日,Unstructured Data Meetup 南京场圆满收官!本次 Meetup 由向量数据库领军者 Zilliz 创办,同时还邀请到来自阿里云、图灵人工智能研究院的技术专家分享行业对于 GenAI 如何连接非结构化数据的思考。

以下是本次 Unstructured Data Meetup 的重点内容:

  • Milvus 开源社区负责人 李成龙 《向量数据库 Milvus 在大模型领域的案例分享》

  • 阿里云人工智能平台 PAI 算法工程师 张晓雯《PAI-RAG:基于阿里云PAI+Milvus 构建面向生产的高效、可拓展的模块化 RAG 系统》

  • 图灵人工智能研究院高级算法工程师 杜文凯《司法大模型的实践应用》

  • 深度学习框架 MindSpore 资深开发者 王峰《Milvus 向量检索在 B、C 端全域实践》 

300a16682030f7072e0ab73675c3beca.png

01.

向量数据库 Milvus 在大模型领域的案例分享

2c93871f73d1b3db36f71ce5ce682574.png

Milvus 开源社区负责人李成龙首先分享了漫画平台 RAG 应用,详细分享了快看 AI 智能问答和 IP 角色互动两个应用场景。其中,AI 智能问答应用的工作框架包含 5 个模块,分别是:知识挖掘、数据索引、检索模块、重排模块、评估模块。李成龙详细介绍了 5 个模块的技术方案和注意事项。随后,李成龙又分享了 IP 角色互动场景的技术框架,主要包含原创剧情知识库和用户个性化记忆知识库。

第二个案例是国际化 VOC SaaS 公司 Shulex 的评论分析应用。相较于单纯只用大模型的方式来对用户评论打标,通过 Zilliz Cloud(Milvus全托管云服务)+大模型的方案来对用户评论打标,成本可以降低 50%,报表生成速度提升 30%。

第三个案例是自动驾驶领域里的长尾样本挖掘。在自动驾驶领域,"corner case"指的是那些不常见、异常或极端的交通场景,例如突如其来的大雾、暴雨、暴风雪等极端天气,或是行人、动物、非常规交通工具的意外出现。这些场景对车辆的感知系统提出了严峻的挑战。通过视觉大模型 LVM(Large Vision Model)和多模态大模型 LMM (Large Multimodal Models)Embedding模型的特征提取能力,结合 Milvus 大规模向量搜索功能,可以完成数百 TB 视频数据的 Corner Case 检索。

最后,李成龙总结了 Milvus 在大模型领域的应用类型,主要分成 RAG 和内容检索两大类,分别利用了大模型的总结归纳能力和 Embedding 能力。

02.

PAI-RAG:基于阿里云 PAI+Milvus 构建面向生产的高效、可拓展的模块化 RAG 系统

e212bb14d0f20bffccbcc7d01db05df4.png

阿里云人工智能平台 PAI 算法工程师张晓雯首先介绍了 RAG 的基本概念,为什么需要 RAG 以及 RAG 的应用场景和挑战。其中落地过程中的主要挑战包括:

  • 客户的知识库领域、格式、内容的多样性,RAG 效果难以保证。

  • 客户需求具有多样性,使用常规 RAG 链路难以实现定制化需求。

  • 构建企业级 RAG 应用的挑战,可靠性、高性能、高质量难以取舍。

  • 数据安全隐私问题,如何进行更安全更稳定的私有化应用部署。

PAI-RAG 具备文档智能、Agentic RAG、多模态检索、高性能可用这些特性。整个架构使用 PAI-EAS 模型服务 + PAI-Blade 推理加速引擎,帮助客户一站式解决 AI 部署和推理的全部环节。基于模块化的设计,使得各个组件都能独立伸缩。向量检索模块使用了向量检索服务 Milvus 版,具有全托管免运维,高性能低成本,安全可用等特点。

最后张晓雯通过一个视频,演示了在阿里云上如何通过 PAI-EAS + Milvus 快速部署一个 RAG 应用。

03.

司法大模型的实践应用

8cf48055d9870d95e14cbb77393da565.png

图灵人工智能研究院高级算法工程师 杜文凯从司法大模型的政策背景、需求分析、解决方案以及落地成果四个方面进行了分享。

关于政策背景,2021 年 3 月,国家颁发《中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要》明确提出,要“加强智慧法院建设”。2022 年 12 月,最高法还发布了《关于规范和加强人工智能司法应用的意见》,从顶层设计、司法数据中台和智慧法院大脑建设、应用系统建设、关键核心技术攻关等五个方面,全方位加强和推动人工智能在司法领域的应用。2022 年 12 月 09 日,最高人民法院 印发《关于规范和加强人工智能司法应用的意见》的通知。

需求分析方面,存在基层法院“案多人少”、地区法官队伍差异大且成长难度大、案件办理流程复杂等问题。司法大模型应运而生,具备低成本、全案由覆盖、易推广等特点。

具体解决方案上,杜文凯介绍了基于本地卷宗管理系统的生成式AI辅助应用系统和灵犀工场大模型平台的架构。并分享了五个具体的应用场景:

  • 场景1:随案卷宗自动更新,材料智能分类。

  • 场景2:全量卷宗一键阅卷,要素智能提取

  • 场景3:  AI助手智能辅助,极简对话交互。

  • 场景4:智能分析归纳,“诉辩-事实-证据”关联。

  • 场景5:法律文书一键生成。

最后,杜文凯介绍司法大模型的落地成果,包括在最高人民法院通过三轮技术论证,并在「AI大脑」部署上线,并且在苏州市中级人民法院上线发布“未来法官助手”系统。

04.

Milvus 向量检索在 B、C 端全域实践

6a369273bd258238976f9eb5e7bdf461.png

深度学习框架 MindSpore 资深开发者王峰首先介绍了 Milvus 的技术架构、应用能力(多租户/Attu/Sizing Tool)和高可用特性(Milvus Backup/CDC)。

在 B 端,王峰介绍了 RAG 应用的架构,包括基础版本以及向 Pipeline/Agent 化演进的版本。此外,还分享了 B 端多模态领域的应用,借助类似 CLIP 等多模态的模型,可以将不同的模态的内容转换成向量问题解,通过检索的方式来应用。

C 端方面,主要介绍了双塔模型的应用,双塔模型经典又简单,就是 NLP 领域的 query 和 document,推荐领域的 user 和 item,多模态检索领域的图像和文字等,都可以用双塔表示。

最后,王峰介绍了将向量检索打造为一个平台化服务方面的思考。主要是抽象各类业务场景共性部分的能力,给业务和工程提效方式,把这些能力服务化,提高复用率。

以上就是本次 Meetup 的全部内容了,微信后台回复关键词「8.17南京」可获取讲师 PPT。

推荐阅读

cc952d5002b49ef5c75410d4afe67e60.png

d8992e297d0a9abc34c75e2ec70615bf.png

d3a009cb02e68dae0e7c3c99cc738825.png

这篇关于Unstructured Data Meetup 南京场收官!干货指南:大模型、向量数据库和 RAG的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1092882

相关文章

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

MySQL数据库宕机,启动不起来,教你一招搞定!

作者介绍:老苏,10余年DBA工作运维经验,擅长Oracle、MySQL、PG、Mongodb数据库运维(如安装迁移,性能优化、故障应急处理等)公众号:老苏畅谈运维欢迎关注本人公众号,更多精彩与您分享。 MySQL数据库宕机,数据页损坏问题,启动不起来,该如何排查和解决,本文将为你说明具体的排查过程。 查看MySQL error日志 查看 MySQL error日志,排查哪个表(表空间

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言