ACM图灵大会开幕,王海峰解读文心大模型3.5最新进展

2024-03-19 15:40

本文主要是介绍ACM图灵大会开幕,王海峰解读文心大模型3.5最新进展,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

5b783cb7894455ac05c988e93497911f.gif

7月28日-30日,顶级学术会议ACM中国图灵大会在武汉举办,围绕“通用智能,人机共生”主题,图灵奖得主、中国科学院院士、企业代表等与会探讨尖端技术及人工智能发展,展望计算科学未来。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰解读文心大模型的核心技术,阐述人工智能产业模式,为人工智能技术及产业发声。据了解,文心一言已成为百度员工工作中的 “超级助理”,Comate智能编码伙伴帮助80%百度工程师提升编程效率,改变了程序开发模式,吸引100多家合作伙伴。

b868ea8c90e1074924376eeb5c0e1adb.png

飞桨开发者数量已达到750万

当前,人工智能已经成为新一轮科技革命和产业变革的重要驱动力量,而深度学习是其关键核心技术,具有很强的通用性,呈现出标准化、自动化、模块化的工业大生产特征,推动人工智能进入工业大生产阶段。大模型具有效果好、泛化性强、研发流程标准化程度高等特点,成为人工智能发展的主流方向。

人工智能时代,IT技术栈发生根本性改变,从芯片、操作系统和应用三层架构,转变为芯片、框架、模型、应用四层架构。深度学习框架和大模型构成了产业智能化基座,支撑各行各业的应用智能化重构。

7b4f883df4716f098f4a9bac053c25e8.png

百度在“芯片-框架-模型-应用”人工智能四层技术栈全面布局,自研的深度学习平台飞桨支撑了文心大模型的高效训练和推理,截至目前飞桨平台开发者数量已达到750万。IDC报告显示,百度稳居中国深度学习平台市场综合份额第一。根据中国信通院发布的《深度学习平台报告(2022)》,飞桨是中国深度学习市场应用规模第一的深度学习框架和赋能平台。

e6c5349915d915c4fac082cf2dd86988.png

据IDC报告,文心大模型综合评分第一

算法模型第一,行业覆盖第一

据了解,文心一言是百度自主研制的知识增强大语言模型,首先从数万亿数据和数千亿知识中融合学习得到预训练大模型,在此基础上采用有监督精调、人类反馈的强化学习和提示等技术,并具备知识增强、检索增强和对话增强等技术优势。

王海峰解读了文心大模型3.5的核心技术创新,通过飞桨与文心协同优化,文心大模型3.5实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等,模型效果提升50%,训练速度提升2倍,推理速度提升30倍。

在基础模型训练上,采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略,并采用多种策略优化数据源及数据分布,加快了模型迭代速度,显著提升了模型效果和安全性。同时,百度研发团队创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术,进一步提升模型效果及场景适配能力。

在知识增强和检索增强基础上,文心大模型3.5提出了“知识点增强技术”,使得模型能够更好地利用精细的知识点来提升理解生成等方面的能力,进而提升对世界知识的掌握和运用。

在推理方面,通过大规模逻辑数据构建、逻辑知识建模、多粒度语义知识组合以及符号神经网络技术,提升文心大模型3.5在逻辑推理、数学计算及代码生成等任务上的表现。

文心大模型3.5还新增了插件机制,包括官方插件百度搜索和ChatFile,使得文心一言能够生成实时准确信息和长文本摘要,拓展了大模型能力边界。

根据IDC最新发布的《AI大模型技术能力评估报告,2023》,百度文心大模型3.5在14个参评模型中拿下12项指标的7个满分,得到“综合评分第一,算法模型第一,行业覆盖第一”三个绝对第一。

42bd01094756ca38342111d7283cc092.png

Comate帮助80%百度工程师提升编程效率

已吸引100多家伙伴

王海峰在演讲中展示了文心一言的问答对话、文案生成、行程规划等能力,以及在办公、会议、编码等场景的应用。

文心一言先是根据要求写了一篇赞美“茶”的文章,全文赞美“茶”却未出现“茶”字,接下来又规划了“武汉一日游”的行程安排,确保能游览黄鹤楼,能吃到地道的武昌鱼,还创作了以“图灵大会”为题的藏头诗。

工作中,文心一言化身“超级助理”,帮助总结工作沟通要点,实时记录会议内容,形成会议议题、摘要及总结等关键信息,可以通过各类插件完成指令任务,包括查询日程、创建会议、设置待办、申请休假等,也可以在工程师编码过程中自动推荐和生成代码。据悉,目前这些功能已通过智能工作平台“如流”应用于百度的工作流程中,Comate智能编码伙伴帮助80%百度工程师提升编程效率,吸引100多家合作伙伴。

对于大模型的产业模式,王海峰表示,在文心一言这类大模型产业落地的进程中,可以采用“集约化生产,平台化应用”的模式,即具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务,支撑产业智能化升级。

11e1a34fb3b71147262dbc267aed0ee8.png

c6b75d7f70c9a1727c5d868a0ec9176a.png

31aa143cc08f34f570cd63f561275437.png

7f16c4ca0fca3cce021e922343087d24.png

e9865da9fe883473594512426d0b647d.gif

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

这篇关于ACM图灵大会开幕,王海峰解读文心大模型3.5最新进展的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/826475

相关文章

Golang的CSP模型简介(最新推荐)

《Golang的CSP模型简介(最新推荐)》Golang采用了CSP(CommunicatingSequentialProcesses,通信顺序进程)并发模型,通过goroutine和channe... 目录前言一、介绍1. 什么是 CSP 模型2. Goroutine3. Channel4. Channe

MySQL中时区参数time_zone解读

《MySQL中时区参数time_zone解读》MySQL时区参数time_zone用于控制系统函数和字段的DEFAULTCURRENT_TIMESTAMP属性,修改时区可能会影响timestamp类型... 目录前言1.时区参数影响2.如何设置3.字段类型选择总结前言mysql 时区参数 time_zon

MySQL中的锁和MVCC机制解读

《MySQL中的锁和MVCC机制解读》MySQL事务、锁和MVCC机制是确保数据库操作原子性、一致性和隔离性的关键,事务必须遵循ACID原则,锁的类型包括表级锁、行级锁和意向锁,MVCC通过非锁定读和... 目录mysql的锁和MVCC机制事务的概念与ACID特性锁的类型及其工作机制锁的粒度与性能影响多版本

Redis过期键删除策略解读

《Redis过期键删除策略解读》Redis通过惰性删除策略和定期删除策略来管理过期键,惰性删除策略在键被访问时检查是否过期并删除,节省CPU开销但可能导致过期键滞留,定期删除策略定期扫描并删除过期键,... 目录1.Redis使用两种不同的策略来删除过期键,分别是惰性删除策略和定期删除策略1.1惰性删除策略

Redis与缓存解读

《Redis与缓存解读》文章介绍了Redis作为缓存层的优势和缺点,并分析了六种缓存更新策略,包括超时剔除、先删缓存再更新数据库、旁路缓存、先更新数据库再删缓存、先更新数据库再更新缓存、读写穿透和异步... 目录缓存缓存优缺点缓存更新策略超时剔除先删缓存再更新数据库旁路缓存(先更新数据库,再删缓存)先更新数

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt

C#反射编程之GetConstructor()方法解读

《C#反射编程之GetConstructor()方法解读》C#中Type类的GetConstructor()方法用于获取指定类型的构造函数,该方法有多个重载版本,可以根据不同的参数获取不同特性的构造函... 目录C# GetConstructor()方法有4个重载以GetConstructor(Type[]

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G