Unstructured Data Meetup 南京场收官!干货指南:大模型、向量数据库和 RAG

本文主要是介绍Unstructured Data Meetup 南京场收官!干货指南:大模型、向量数据库和 RAG,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

a81ce3849c5f8d49c6cabb811ed9065d.png

近日,Unstructured Data Meetup 南京场圆满收官!本次 Meetup 由向量数据库领军者 Zilliz 创办,同时还邀请到来自阿里云、图灵人工智能研究院的技术专家分享行业对于 GenAI 如何连接非结构化数据的思考。

以下是本次 Unstructured Data Meetup 的重点内容:

  • Milvus 开源社区负责人 李成龙 《向量数据库 Milvus 在大模型领域的案例分享》

  • 阿里云人工智能平台 PAI 算法工程师 张晓雯《PAI-RAG:基于阿里云PAI+Milvus 构建面向生产的高效、可拓展的模块化 RAG 系统》

  • 图灵人工智能研究院高级算法工程师 杜文凯《司法大模型的实践应用》

  • 深度学习框架 MindSpore 资深开发者 王峰《Milvus 向量检索在 B、C 端全域实践》 

300a16682030f7072e0ab73675c3beca.png

01.

向量数据库 Milvus 在大模型领域的案例分享

2c93871f73d1b3db36f71ce5ce682574.png

Milvus 开源社区负责人李成龙首先分享了漫画平台 RAG 应用,详细分享了快看 AI 智能问答和 IP 角色互动两个应用场景。其中,AI 智能问答应用的工作框架包含 5 个模块,分别是:知识挖掘、数据索引、检索模块、重排模块、评估模块。李成龙详细介绍了 5 个模块的技术方案和注意事项。随后,李成龙又分享了 IP 角色互动场景的技术框架,主要包含原创剧情知识库和用户个性化记忆知识库。

第二个案例是国际化 VOC SaaS 公司 Shulex 的评论分析应用。相较于单纯只用大模型的方式来对用户评论打标,通过 Zilliz Cloud(Milvus全托管云服务)+大模型的方案来对用户评论打标,成本可以降低 50%,报表生成速度提升 30%。

第三个案例是自动驾驶领域里的长尾样本挖掘。在自动驾驶领域,"corner case"指的是那些不常见、异常或极端的交通场景,例如突如其来的大雾、暴雨、暴风雪等极端天气,或是行人、动物、非常规交通工具的意外出现。这些场景对车辆的感知系统提出了严峻的挑战。通过视觉大模型 LVM(Large Vision Model)和多模态大模型 LMM (Large Multimodal Models)Embedding模型的特征提取能力,结合 Milvus 大规模向量搜索功能,可以完成数百 TB 视频数据的 Corner Case 检索。

最后,李成龙总结了 Milvus 在大模型领域的应用类型,主要分成 RAG 和内容检索两大类,分别利用了大模型的总结归纳能力和 Embedding 能力。

02.

PAI-RAG:基于阿里云 PAI+Milvus 构建面向生产的高效、可拓展的模块化 RAG 系统

e212bb14d0f20bffccbcc7d01db05df4.png

阿里云人工智能平台 PAI 算法工程师张晓雯首先介绍了 RAG 的基本概念,为什么需要 RAG 以及 RAG 的应用场景和挑战。其中落地过程中的主要挑战包括:

  • 客户的知识库领域、格式、内容的多样性,RAG 效果难以保证。

  • 客户需求具有多样性,使用常规 RAG 链路难以实现定制化需求。

  • 构建企业级 RAG 应用的挑战,可靠性、高性能、高质量难以取舍。

  • 数据安全隐私问题,如何进行更安全更稳定的私有化应用部署。

PAI-RAG 具备文档智能、Agentic RAG、多模态检索、高性能可用这些特性。整个架构使用 PAI-EAS 模型服务 + PAI-Blade 推理加速引擎,帮助客户一站式解决 AI 部署和推理的全部环节。基于模块化的设计,使得各个组件都能独立伸缩。向量检索模块使用了向量检索服务 Milvus 版,具有全托管免运维,高性能低成本,安全可用等特点。

最后张晓雯通过一个视频,演示了在阿里云上如何通过 PAI-EAS + Milvus 快速部署一个 RAG 应用。

03.

司法大模型的实践应用

8cf48055d9870d95e14cbb77393da565.png

图灵人工智能研究院高级算法工程师 杜文凯从司法大模型的政策背景、需求分析、解决方案以及落地成果四个方面进行了分享。

关于政策背景,2021 年 3 月,国家颁发《中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要》明确提出,要“加强智慧法院建设”。2022 年 12 月,最高法还发布了《关于规范和加强人工智能司法应用的意见》,从顶层设计、司法数据中台和智慧法院大脑建设、应用系统建设、关键核心技术攻关等五个方面,全方位加强和推动人工智能在司法领域的应用。2022 年 12 月 09 日,最高人民法院 印发《关于规范和加强人工智能司法应用的意见》的通知。

需求分析方面,存在基层法院“案多人少”、地区法官队伍差异大且成长难度大、案件办理流程复杂等问题。司法大模型应运而生,具备低成本、全案由覆盖、易推广等特点。

具体解决方案上,杜文凯介绍了基于本地卷宗管理系统的生成式AI辅助应用系统和灵犀工场大模型平台的架构。并分享了五个具体的应用场景:

  • 场景1:随案卷宗自动更新,材料智能分类。

  • 场景2:全量卷宗一键阅卷,要素智能提取

  • 场景3:  AI助手智能辅助,极简对话交互。

  • 场景4:智能分析归纳,“诉辩-事实-证据”关联。

  • 场景5:法律文书一键生成。

最后,杜文凯介绍司法大模型的落地成果,包括在最高人民法院通过三轮技术论证,并在「AI大脑」部署上线,并且在苏州市中级人民法院上线发布“未来法官助手”系统。

04.

Milvus 向量检索在 B、C 端全域实践

6a369273bd258238976f9eb5e7bdf461.png

深度学习框架 MindSpore 资深开发者王峰首先介绍了 Milvus 的技术架构、应用能力(多租户/Attu/Sizing Tool)和高可用特性(Milvus Backup/CDC)。

在 B 端,王峰介绍了 RAG 应用的架构,包括基础版本以及向 Pipeline/Agent 化演进的版本。此外,还分享了 B 端多模态领域的应用,借助类似 CLIP 等多模态的模型,可以将不同的模态的内容转换成向量问题解,通过检索的方式来应用。

C 端方面,主要介绍了双塔模型的应用,双塔模型经典又简单,就是 NLP 领域的 query 和 document,推荐领域的 user 和 item,多模态检索领域的图像和文字等,都可以用双塔表示。

最后,王峰介绍了将向量检索打造为一个平台化服务方面的思考。主要是抽象各类业务场景共性部分的能力,给业务和工程提效方式,把这些能力服务化,提高复用率。

以上就是本次 Meetup 的全部内容了,微信后台回复关键词「8.17南京」可获取讲师 PPT。

推荐阅读

cc952d5002b49ef5c75410d4afe67e60.png

d8992e297d0a9abc34c75e2ec70615bf.png

d3a009cb02e68dae0e7c3c99cc738825.png

这篇关于Unstructured Data Meetup 南京场收官!干货指南:大模型、向量数据库和 RAG的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1092882

相关文章

Golang的CSP模型简介(最新推荐)

《Golang的CSP模型简介(最新推荐)》Golang采用了CSP(CommunicatingSequentialProcesses,通信顺序进程)并发模型,通过goroutine和channe... 目录前言一、介绍1. 什么是 CSP 模型2. Goroutine3. Channel4. Channe

IDEA如何切换数据库版本mysql5或mysql8

《IDEA如何切换数据库版本mysql5或mysql8》本文介绍了如何将IntelliJIDEA从MySQL5切换到MySQL8的详细步骤,包括下载MySQL8、安装、配置、停止旧服务、启动新服务以及... 目录问题描述解决方案第一步第二步第三步第四步第五步总结问题描述最近想开发一个新应用,想使用mysq

Python使用qrcode库实现生成二维码的操作指南

《Python使用qrcode库实现生成二维码的操作指南》二维码是一种广泛使用的二维条码,因其高效的数据存储能力和易于扫描的特点,广泛应用于支付、身份验证、营销推广等领域,Pythonqrcode库是... 目录一、安装 python qrcode 库二、基本使用方法1. 生成简单二维码2. 生成带 Log

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,

高效管理你的Linux系统: Debian操作系统常用命令指南

《高效管理你的Linux系统:Debian操作系统常用命令指南》在Debian操作系统中,了解和掌握常用命令对于提高工作效率和系统管理至关重要,本文将详细介绍Debian的常用命令,帮助读者更好地使... Debian是一个流行的linux发行版,它以其稳定性、强大的软件包管理和丰富的社区资源而闻名。在使用

macOS怎么轻松更换App图标? Mac电脑图标更换指南

《macOS怎么轻松更换App图标?Mac电脑图标更换指南》想要给你的Mac电脑按照自己的喜好来更换App图标?其实非常简单,只需要两步就能搞定,下面我来详细讲解一下... 虽然 MACOS 的个性化定制选项已经「缩水」,不如早期版本那么丰富,www.chinasem.cn但我们仍然可以按照自己的喜好来更换

Python使用Pandas库将Excel数据叠加生成新DataFrame的操作指南

《Python使用Pandas库将Excel数据叠加生成新DataFrame的操作指南》在日常数据处理工作中,我们经常需要将不同Excel文档中的数据整合到一个新的DataFrame中,以便进行进一步... 目录一、准备工作二、读取Excel文件三、数据叠加四、处理重复数据(可选)五、保存新DataFram

Java读取InfluxDB数据库的方法详解

《Java读取InfluxDB数据库的方法详解》本文介绍基于Java语言,读取InfluxDB数据库的方法,包括读取InfluxDB的所有数据库,以及指定数据库中的measurement、field、... 首先,创建一个Java项目,用于撰写代码。接下来,配置所需要的依赖;这里我们就选择可用于与Infl

详谈redis跟数据库的数据同步问题

《详谈redis跟数据库的数据同步问题》文章讨论了在Redis和数据库数据一致性问题上的解决方案,主要比较了先更新Redis缓存再更新数据库和先更新数据库再更新Redis缓存两种方案,文章指出,删除R... 目录一、Redis 数据库数据一致性的解决方案1.1、更新Redis缓存、删除Redis缓存的区别二

oracle数据库索引失效的问题及解决

《oracle数据库索引失效的问题及解决》本文总结了在Oracle数据库中索引失效的一些常见场景,包括使用isnull、isnotnull、!=、、、函数处理、like前置%查询以及范围索引和等值索引... 目录oracle数据库索引失效问题场景环境索引失效情况及验证结论一结论二结论三结论四结论五总结ora