内修昇思MindSpore AI框架,外重行业汇聚,华为大模型的不平凡之路

2023-11-24 17:40

本文主要是介绍内修昇思MindSpore AI框架,外重行业汇聚,华为大模型的不平凡之路,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

要说近几年深度学习领域最热门的研究课题有哪些?大模型肯定在列。从 2020 年 OpenAI 发布 1750 亿参数的 GPT-3 开始,炼大模型这股潮流变得不可阻挡。依托自身效果好、泛化能力强等特点,大模型进一步增强 AI 的通用性,更成为 AI 技术和应用的新基座。

科技巨头们纷纷下场,接连推出千亿甚至万亿参数级的大模型。而纵观现有大模型,NLP、CV 以及多模态成为三个主要的发力方向,这些偏向于基础大模型;同时,能否落地应用成为检测大模型能力的重要指标,因此具备丰富领域知识的行业大模型也越来越受到业界的关注。

在大模型这条赛道上,国内 AI 厂商各显神通。华为也不例外,原生支持大模型训练的昇思 MindSpore AI 框架成为其发展大模型的关键。昇思 MindSpore 的开源开放使得国内产学界一些科研机构基于它打造了一系列大模型。

据了解,昇思 MindSpore 在进行架构设计时就考虑了大模型开发时遇到的内存占用、通信瓶颈、调试复杂、部署难等问题,针对性的技术研究与创新:

  • 业界领先的全自动并行能力,提供 6 维混合并行算法,即数据并行、模型并行、流水并行、优化器并行等,一行代码实现模型自动切分、分布式并行计算,开发并行代码量降低 80%、系统调优时间下降 60%;

  • 极致的全局内存复用能力,在开发者无感知的情况下,自动实现 NPU 内存 / CPU 内存 / NVMe 硬盘存储的多级存储优化,512 卡就可训练 10 万亿规模的参数模型,极大降低大模型训练成本;

  • 极简的断点续训能力,可解决大集群训练故障导致的任务中断问题,实现自动恢复、继承性训练,开发者无需从头开始,千亿参数模型在分钟级就可无损恢复。

鹏城实验室基于昇思 MindSpore 先后推出了业界首个 2000 亿参数中文预训练语言模型鹏程.盘古和面向生物医学领域的鹏程.神农大模型、中科院自动化所基于昇思 MindSpore 推出了业界首个图文音三模态大模型紫东.太初、武汉大学基于昇思 MindSpore 研发了全球首个智能遥感框架及数据集武汉.LuoJia。

同时,将大模型能力开放给开发者也非常重要。昇思 MindSpore 没有忽视这一点,推出了一站式大模型体验平台,让你我皆可触碰大模型的魅力。

依托昇思MindSpore

构筑基础 + 行业大模型的整体布局

人工智能有三大支柱,分别为算力、数据和算法。根据中国信息通信研究院《AI 框架发展白皮书》的描述,AI 框架正是算法模型设计、训练和验证的一套标准接口、特性库和工具包。目前,流行的 AI 框架有国内的昇思 MindSpore、国外的 TensorFlow、PyTorch 等。 

2020 年 3 月 28 日,华为将全场景 AI 计算框架昇思 MindSpore 正式开源,致力于构筑面向全球的开源社区,持续推动 AI 开源生态繁荣发展。随着越来越多的知名高校和科研机构拥抱昇思 MindSpore,它们联合昇思 MindSpore 先后打造出了覆盖 NLP、CV 和多模态融合以及特定于某个领域的专用大模型,逐渐形成了基础大模型 + 行业大模型的整体布局。

昇思 MindSpore 总体架构。

四大模型介绍

2021 年 5 月,在华为生态大会 2021「昇腾万里 共赢智能新时代」上,鹏城实验室基于昇思 MindSpore 推出了全球首个 2000 亿参数中文 NLP 大模型鹏程.盘古,它在预训练阶段学习了 40TB 的中文文本数据。在性能方面,鹏程.盘古在 16 个下游任务中性能指标优于业界 SOTA 模型;在应用方面,鹏程.盘古在知识问答、知识检索、知识推理等丰富的文本生成领域表现突出。 

为了让鹏程.盘古大模型在各行各业的语言类场景下发挥作用,它的模型、代码和数据集在 OpenI 启智社区进行开源开放,吸引大家共同参与到模型的压缩轻量化和应用创新工作中,不断挖掘鹏程.盘古的巨大潜力。

鹏程.盘古大模型专注于文本模态,多模态则是 AI 世界的常态。推及到预训练大模型,业界广泛认为由单模态扩展至多模态是必由之路。中科院自动化所基于昇思 MindSpore 打造了全球首个千亿参数三模态大模型紫东.太初,通过跨模态语义关联达成了视觉-文本-语音三模态的统一表达和高效协同。

紫东.太初多模态大模型具有超强的图文音跨模态理解与生成能力,与单模态相比,只需要一个大模型就能支撑图文音全场景 AI 应用。紫东.太初大幅提升文本、语音、图像和视频等领域的基础任务性能,在多模态内容的理解、搜索、推荐和问答、语音识别和合成、人机交互和无人驾驶等商业应用中具有巨大的市场价值。紫东.太初同样坚持基础模型开源的开源开放,通过开源的形式将模型分享业界使用,让伙伴们基于紫东.太初孵化更多的行业应用,同时开源协作还将有利于模型进一步升级,开发者可以在紫东.太初模型代码的基础上持续创新

在华为全联接 2021 上,自动化所所长徐波演示了紫东.太初训练出来的虚拟人小初的语音生成视频能力。

无论是鹏程.盘古,还是紫东.太初,都属于基础大模型。接下来要说的是行业大模型,当被输入丰富的行业知识时,更专的大模型也就出现了。

同样在华为全联接 2021 上,鹏城实验室基于昇思 MindSpore AI 框架打造的鹏程.神农大模型正式发布,它是面向生物医学领域的AI平台,包含蛋白质结构预测、小分子生成、靶点与小分子相互作用预测以及新抗菌多肽设计与效果评价等模块,深度赋能生物制药。借助鹏程.神农的能力,制药企业和医学研究机构将大大加速新型药物的筛选与创制。

在抗菌肽(下一代抗菌素)的探索中,借助鹏程.神农大模型强大的氨基酸序列生成能力,并结合现有抗菌肽数据集,人们可以在很短时间内产生数万种候选肽的氨基酸序列。传统方法在长达四十年的时间里仅仅生成4000多种候选多肽,而鹏程.神农 + 抗菌肽分类器的组合在数月内产生30万种候选多肽。前后效果对比可见一斑,这也正是大模型的魔力。

2021年7月,武汉大学正式推出武汉.LuoJia,包含全球首个遥感影像智能解译专用框架武汉.LuoJiaNET 和业界最大遥感影像样本数据集武汉.LuoJiaSET并已于今年6月分别上线昇腾和昇思社区。武汉.LuoJia 整体解决方案为遥感应用开发提供便利,让智能遥感技术在自然资源、海洋、农业、森林、应急等行业得到广泛应用。

武汉.LuoJiaNET 针对遥感数据存在的像幅尺寸大、数据通道多、尺度变化大等特点,兼具内存可扩展、尺度通道灵活创建、数据通道自主优选、框架与数据协同处理等特性。其构建了针对遥感影像「场景 - 目标 - 像素」多维度的遥感应用模型,能够完成场景检索、目标检测、地物分类、变化检测、多视角三维重建等任务。

武汉.LuoJiaSET 则是遥感领域满足 OGC 标准的大规模遥感影像样本库,制定了支持全球范围的遥感影像样本分类标准、标注规范,建立涵盖不同遥感任务的统一分类体系,形成样本要素的采集要求、内容和流程规范,支持多级别、多类型遥感影像样本库的采集、制作、管理、共享和应用。

武汉.LuoJia 整体解决方案。

从这些大模型来看,华为已经形成了一套清晰和成熟的支持大模型发展的路径,即通过科研机构基于昇腾 AI,利用全场景 AI 框架昇思 MindSpore,打造各类大模型如鹏程.盘古和鹏程.神农大模型利用了「鹏城云脑 II」超大规模 AI 集群,紫东.太初和武汉.LuoJia 利用了武汉人工智能计算中心 AI 集群。如此一来,昇思 MindSpore AI 框架赋能+ 昇腾 AI 提供的强大算力底座,形成的良性循环将进一步为大模型的研发注入活力。

在华为伙伴暨开发者大会 2022 上,华为发布了其昇腾大模型沙盘规划,明确了基础大模型和行业大模型/应用并行发展的整体布局。在继续推进 NLP、CV 和多模态等基础 AI 创新的同时,立足于行业以实现大模型在互联网、电力、智慧城市、金融和农业等更多领域发光发热。

昇思大模型体验平台上线

在大模型实现落地应用的过程中,开发者的实际体验和意见反馈是非常重要的一环。目前来看,构建体验平台和开发者社区是比较流行的做法。如此一来,开发者可以在终端上手体验大模型的能力,并及时给予反馈以便进一步改进和完善。

基于此,昇思MindSpore社区打造了一站式大模型体验平台,并于今日正式上线。开发者可以在线体验大模型推理任务,从而最便捷地使用基于昇思的创新大模型。

据了解,昇思大模型体验平台的亮点在于集模型选型、在线推理、在线训练为一体,还支持了 Gradio 项目可视化推理、在线进行迁移学习。开发者可以在线查询基于昇思 MindSpore 构建的模型和数据集,并选择自己感兴趣的大模型及相关任务,如鹏城.盘古大模型的知识问答、检索和推理等、紫东.太初多模态大模型的以音搜图、以图生音和以音生图等。

  • 昇思大模型体验平台:https://xihe.mindspore.cn

昇思大模型体验平台将于即日起开启公测,截止至 9 月 30 日参与平台公测将可享受以下福利:

  • 第一阶:首次注册,赠送 1 小时算力

  • 第二阶:下载首个模型,赠送 1 小时算力

  • 第三阶:邀请新用户成功注册,邀请最多新用户的前三名老用户,赠送价值 5000 元、3000 元、1000 元京东卡

  • 第四阶:下载模型最多用户,前三位赠送价值 3000 元、2000 元、1000 元京东卡

  • 第五阶:创建可运行项目最多的前三位赠送 2000 元、1000 元 、500 元的算力

联系小助手即可领取相应福利;微信 mindspore0328

结语

在各大科技巨头纷纷下注大模型赛道的当下,形成自己的核心竞争力变得尤为重要。昇思 MindSpore AI 框架已经成为了大模型研发的技术支撑,开源开放更使得产学界可以基于它研发自己的大模型。当前,华为联合科研机构和产业界,基于昇思 MindSpore AI 框架与各地人工智能计算中心的昇腾 AI 强大算力不断发展基础大模型和行业大模型的产业生态,赋能千行百业数字化、智能化。

同时,为了进一步促进大模型的产业化落地,华为携手合作伙伴成立多个产业联盟,如基于武汉.LuoJia 的智能遥感开源生态联盟和基于紫东.太初的多模态人工智能产业联盟。今年,华为还计划推出 AI 流体力学产业联盟、AI 生物医药产业联盟等。

图源:华为伙伴暨开发者大会 2022

产业联盟的建立一方面促进合作伙伴基于已有大模型孵化更多行业应用,让大模型真正赋能产业;另一方面大模型得到了行业更丰富数据、和更泛化应用场景的反哺,由此带来基础能力的不断提升,让大模型更智能、更适配应用场景。

参考链接:

https://www.mindspore.cn/largeModel/taichu

https://www.mindspore.cn/largeModel/pangu

https://www.pcl.ac.cn/html/943/2021-09-26/content-3858.html

http://www.caict.ac.cn/english/research/whitepapers/202203/P020220322344729036910.pdf

MindSpore官方资料

官方QQ群 : 486831414

官网:https://www.mindspore.cn/

Gitee : https : //gitee.com/mindspore/mindspore

GitHub : https://github.com/mindspore-ai/mindspore

论坛:https://bbs.huaweicloud.com/forum/forum-1076-1.html 

这篇关于内修昇思MindSpore AI框架,外重行业汇聚,华为大模型的不平凡之路的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/422315

相关文章

揭秘未来艺术:AI绘画工具全面介绍

📑前言 随着科技的飞速发展,人工智能(AI)已经逐渐渗透到我们生活的方方面面。在艺术创作领域,AI技术同样展现出了其独特的魅力。今天,我们就来一起探索这个神秘而引人入胜的领域,深入了解AI绘画工具的奥秘及其为艺术创作带来的革命性变革。 一、AI绘画工具的崛起 1.1 颠覆传统绘画模式 在过去,绘画是艺术家们通过手中的画笔,蘸取颜料,在画布上自由挥洒的创造性过程。然而,随着AI绘画工

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

AI儿童绘本创作

之前分享过AI儿童绘画的项目,但是主要问题是角色一致要花费很长的时间! 今天发现了这款,非常奈斯! 只需输入故事主题、风格、模板,软件就会自动创作故事内容,自动生成插画配图,自动根据模板生成成品,测试效果如下图。 变现方式:生成儿童绘本发布到各平台,吸引宝妈群体进私域。  百度网盘 请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全

大语言模型(LLMs)能够进行推理和规划吗?

大语言模型(LLMs),基本上是经过强化训练的 n-gram 模型,它们在网络规模的语言语料库(实际上,可以说是我们文明的知识库)上进行了训练,展现出了一种超乎预期的语言行为,引发了我们的广泛关注。从训练和操作的角度来看,LLMs 可以被认为是一种巨大的、非真实的记忆库,相当于为我们所有人提供了一个外部的系统 1(见图 1)。然而,它们表面上的多功能性让许多研究者好奇,这些模型是否也能在通常需要系

人工和AI大语言模型成本对比 ai语音模型

这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。 但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。让“今天天气很好”的概率高于“今天天汽很好”的概率,得到声学模型概率高,又符合表达

智能客服到个人助理,国内AI大模型如何改变我们的生活?

引言 随着人工智能(AI)技术的高速发展,AI大模型越来越多地出现在我们的日常生活和工作中。国内的AI大模型在过去几年里取得了显著的进展,不少独创的技术点和实际应用令人瞩目。 那么,国内的AI大模型有哪些独创的技术点?它们在实际应用中又有哪些出色表现呢?此外,普通人又该如何利用这些大模型提升工作和生活的质量和效率呢?本文将为你一一解析。 一、国内AI大模型的独创技术点 多模态学习 多

【科技前沿】电子设计新贵SmartEDA:为何它引领行业风潮?

在当今这个电子科技日新月异的时代,电子设计工具如同设计师的魔法棒,不断推动着产品创新的速度。而近期,一款名为SmartEDA的电子国产设计仿真软件异军突起,成为了行业内的新宠。那么,SmartEDA究竟有何过人之处,为何它能够如此受欢迎呢? 一、智能化设计,提升效率 SmartEDA的核心优势,能够完成电路设计的优化、仿真和验证等复杂过程。这不仅大大减少了设计师的工作量,还提高了设计的准确

【新闻】AI程序员要来了吗?阿里云官宣

内容提要 6 月 21 日,在阿里云上海 AI 峰会上,阿里云宣布推出首个AI 程序员。 据介绍,这个AI程序员具备架构师、开发工程师、测试工程师等多种岗位的技能,能一站式自主完成任务分解、代码编写、测试、问题修复、代码提交整个过程,最快分钟级即可完成应用开发,大幅提升研发效率。 近段时间以来,有关AI的实践应用突破不断,全球开发者加速研发步伐。有业内人士坦言,随着大模型性能逐渐提升,AI应

OpenCompass:大模型测评工具

大模型相关目录 大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容 从0起步,扬帆起航。 大模型应用向开发路径:AI代理工作流大模型应用开发实用开源项目汇总大模型问答项目问答性能评估方法大模型数据侧总结大模型token等基本概念及参数和内存的关系大模型应用开发-华为大模型生态规划从零开始的LLaMA-Factor

模型压缩综述

https://www.cnblogs.com/shixiangwan/p/9015010.html