内修昇思MindSpore AI框架,外重行业汇聚,华为大模型的不平凡之路

2023-11-24 17:40

本文主要是介绍内修昇思MindSpore AI框架,外重行业汇聚,华为大模型的不平凡之路,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

要说近几年深度学习领域最热门的研究课题有哪些?大模型肯定在列。从 2020 年 OpenAI 发布 1750 亿参数的 GPT-3 开始,炼大模型这股潮流变得不可阻挡。依托自身效果好、泛化能力强等特点,大模型进一步增强 AI 的通用性,更成为 AI 技术和应用的新基座。

科技巨头们纷纷下场,接连推出千亿甚至万亿参数级的大模型。而纵观现有大模型,NLP、CV 以及多模态成为三个主要的发力方向,这些偏向于基础大模型;同时,能否落地应用成为检测大模型能力的重要指标,因此具备丰富领域知识的行业大模型也越来越受到业界的关注。

在大模型这条赛道上,国内 AI 厂商各显神通。华为也不例外,原生支持大模型训练的昇思 MindSpore AI 框架成为其发展大模型的关键。昇思 MindSpore 的开源开放使得国内产学界一些科研机构基于它打造了一系列大模型。

据了解,昇思 MindSpore 在进行架构设计时就考虑了大模型开发时遇到的内存占用、通信瓶颈、调试复杂、部署难等问题,针对性的技术研究与创新:

  • 业界领先的全自动并行能力,提供 6 维混合并行算法,即数据并行、模型并行、流水并行、优化器并行等,一行代码实现模型自动切分、分布式并行计算,开发并行代码量降低 80%、系统调优时间下降 60%;

  • 极致的全局内存复用能力,在开发者无感知的情况下,自动实现 NPU 内存 / CPU 内存 / NVMe 硬盘存储的多级存储优化,512 卡就可训练 10 万亿规模的参数模型,极大降低大模型训练成本;

  • 极简的断点续训能力,可解决大集群训练故障导致的任务中断问题,实现自动恢复、继承性训练,开发者无需从头开始,千亿参数模型在分钟级就可无损恢复。

鹏城实验室基于昇思 MindSpore 先后推出了业界首个 2000 亿参数中文预训练语言模型鹏程.盘古和面向生物医学领域的鹏程.神农大模型、中科院自动化所基于昇思 MindSpore 推出了业界首个图文音三模态大模型紫东.太初、武汉大学基于昇思 MindSpore 研发了全球首个智能遥感框架及数据集武汉.LuoJia。

同时,将大模型能力开放给开发者也非常重要。昇思 MindSpore 没有忽视这一点,推出了一站式大模型体验平台,让你我皆可触碰大模型的魅力。

依托昇思MindSpore

构筑基础 + 行业大模型的整体布局

人工智能有三大支柱,分别为算力、数据和算法。根据中国信息通信研究院《AI 框架发展白皮书》的描述,AI 框架正是算法模型设计、训练和验证的一套标准接口、特性库和工具包。目前,流行的 AI 框架有国内的昇思 MindSpore、国外的 TensorFlow、PyTorch 等。 

2020 年 3 月 28 日,华为将全场景 AI 计算框架昇思 MindSpore 正式开源,致力于构筑面向全球的开源社区,持续推动 AI 开源生态繁荣发展。随着越来越多的知名高校和科研机构拥抱昇思 MindSpore,它们联合昇思 MindSpore 先后打造出了覆盖 NLP、CV 和多模态融合以及特定于某个领域的专用大模型,逐渐形成了基础大模型 + 行业大模型的整体布局。

昇思 MindSpore 总体架构。

四大模型介绍

2021 年 5 月,在华为生态大会 2021「昇腾万里 共赢智能新时代」上,鹏城实验室基于昇思 MindSpore 推出了全球首个 2000 亿参数中文 NLP 大模型鹏程.盘古,它在预训练阶段学习了 40TB 的中文文本数据。在性能方面,鹏程.盘古在 16 个下游任务中性能指标优于业界 SOTA 模型;在应用方面,鹏程.盘古在知识问答、知识检索、知识推理等丰富的文本生成领域表现突出。 

为了让鹏程.盘古大模型在各行各业的语言类场景下发挥作用,它的模型、代码和数据集在 OpenI 启智社区进行开源开放,吸引大家共同参与到模型的压缩轻量化和应用创新工作中,不断挖掘鹏程.盘古的巨大潜力。

鹏程.盘古大模型专注于文本模态,多模态则是 AI 世界的常态。推及到预训练大模型,业界广泛认为由单模态扩展至多模态是必由之路。中科院自动化所基于昇思 MindSpore 打造了全球首个千亿参数三模态大模型紫东.太初,通过跨模态语义关联达成了视觉-文本-语音三模态的统一表达和高效协同。

紫东.太初多模态大模型具有超强的图文音跨模态理解与生成能力,与单模态相比,只需要一个大模型就能支撑图文音全场景 AI 应用。紫东.太初大幅提升文本、语音、图像和视频等领域的基础任务性能,在多模态内容的理解、搜索、推荐和问答、语音识别和合成、人机交互和无人驾驶等商业应用中具有巨大的市场价值。紫东.太初同样坚持基础模型开源的开源开放,通过开源的形式将模型分享业界使用,让伙伴们基于紫东.太初孵化更多的行业应用,同时开源协作还将有利于模型进一步升级,开发者可以在紫东.太初模型代码的基础上持续创新

在华为全联接 2021 上,自动化所所长徐波演示了紫东.太初训练出来的虚拟人小初的语音生成视频能力。

无论是鹏程.盘古,还是紫东.太初,都属于基础大模型。接下来要说的是行业大模型,当被输入丰富的行业知识时,更专的大模型也就出现了。

同样在华为全联接 2021 上,鹏城实验室基于昇思 MindSpore AI 框架打造的鹏程.神农大模型正式发布,它是面向生物医学领域的AI平台,包含蛋白质结构预测、小分子生成、靶点与小分子相互作用预测以及新抗菌多肽设计与效果评价等模块,深度赋能生物制药。借助鹏程.神农的能力,制药企业和医学研究机构将大大加速新型药物的筛选与创制。

在抗菌肽(下一代抗菌素)的探索中,借助鹏程.神农大模型强大的氨基酸序列生成能力,并结合现有抗菌肽数据集,人们可以在很短时间内产生数万种候选肽的氨基酸序列。传统方法在长达四十年的时间里仅仅生成4000多种候选多肽,而鹏程.神农 + 抗菌肽分类器的组合在数月内产生30万种候选多肽。前后效果对比可见一斑,这也正是大模型的魔力。

2021年7月,武汉大学正式推出武汉.LuoJia,包含全球首个遥感影像智能解译专用框架武汉.LuoJiaNET 和业界最大遥感影像样本数据集武汉.LuoJiaSET并已于今年6月分别上线昇腾和昇思社区。武汉.LuoJia 整体解决方案为遥感应用开发提供便利,让智能遥感技术在自然资源、海洋、农业、森林、应急等行业得到广泛应用。

武汉.LuoJiaNET 针对遥感数据存在的像幅尺寸大、数据通道多、尺度变化大等特点,兼具内存可扩展、尺度通道灵活创建、数据通道自主优选、框架与数据协同处理等特性。其构建了针对遥感影像「场景 - 目标 - 像素」多维度的遥感应用模型,能够完成场景检索、目标检测、地物分类、变化检测、多视角三维重建等任务。

武汉.LuoJiaSET 则是遥感领域满足 OGC 标准的大规模遥感影像样本库,制定了支持全球范围的遥感影像样本分类标准、标注规范,建立涵盖不同遥感任务的统一分类体系,形成样本要素的采集要求、内容和流程规范,支持多级别、多类型遥感影像样本库的采集、制作、管理、共享和应用。

武汉.LuoJia 整体解决方案。

从这些大模型来看,华为已经形成了一套清晰和成熟的支持大模型发展的路径,即通过科研机构基于昇腾 AI,利用全场景 AI 框架昇思 MindSpore,打造各类大模型如鹏程.盘古和鹏程.神农大模型利用了「鹏城云脑 II」超大规模 AI 集群,紫东.太初和武汉.LuoJia 利用了武汉人工智能计算中心 AI 集群。如此一来,昇思 MindSpore AI 框架赋能+ 昇腾 AI 提供的强大算力底座,形成的良性循环将进一步为大模型的研发注入活力。

在华为伙伴暨开发者大会 2022 上,华为发布了其昇腾大模型沙盘规划,明确了基础大模型和行业大模型/应用并行发展的整体布局。在继续推进 NLP、CV 和多模态等基础 AI 创新的同时,立足于行业以实现大模型在互联网、电力、智慧城市、金融和农业等更多领域发光发热。

昇思大模型体验平台上线

在大模型实现落地应用的过程中,开发者的实际体验和意见反馈是非常重要的一环。目前来看,构建体验平台和开发者社区是比较流行的做法。如此一来,开发者可以在终端上手体验大模型的能力,并及时给予反馈以便进一步改进和完善。

基于此,昇思MindSpore社区打造了一站式大模型体验平台,并于今日正式上线。开发者可以在线体验大模型推理任务,从而最便捷地使用基于昇思的创新大模型。

据了解,昇思大模型体验平台的亮点在于集模型选型、在线推理、在线训练为一体,还支持了 Gradio 项目可视化推理、在线进行迁移学习。开发者可以在线查询基于昇思 MindSpore 构建的模型和数据集,并选择自己感兴趣的大模型及相关任务,如鹏城.盘古大模型的知识问答、检索和推理等、紫东.太初多模态大模型的以音搜图、以图生音和以音生图等。

  • 昇思大模型体验平台:https://xihe.mindspore.cn

昇思大模型体验平台将于即日起开启公测,截止至 9 月 30 日参与平台公测将可享受以下福利:

  • 第一阶:首次注册,赠送 1 小时算力

  • 第二阶:下载首个模型,赠送 1 小时算力

  • 第三阶:邀请新用户成功注册,邀请最多新用户的前三名老用户,赠送价值 5000 元、3000 元、1000 元京东卡

  • 第四阶:下载模型最多用户,前三位赠送价值 3000 元、2000 元、1000 元京东卡

  • 第五阶:创建可运行项目最多的前三位赠送 2000 元、1000 元 、500 元的算力

联系小助手即可领取相应福利;微信 mindspore0328

结语

在各大科技巨头纷纷下注大模型赛道的当下,形成自己的核心竞争力变得尤为重要。昇思 MindSpore AI 框架已经成为了大模型研发的技术支撑,开源开放更使得产学界可以基于它研发自己的大模型。当前,华为联合科研机构和产业界,基于昇思 MindSpore AI 框架与各地人工智能计算中心的昇腾 AI 强大算力不断发展基础大模型和行业大模型的产业生态,赋能千行百业数字化、智能化。

同时,为了进一步促进大模型的产业化落地,华为携手合作伙伴成立多个产业联盟,如基于武汉.LuoJia 的智能遥感开源生态联盟和基于紫东.太初的多模态人工智能产业联盟。今年,华为还计划推出 AI 流体力学产业联盟、AI 生物医药产业联盟等。

图源:华为伙伴暨开发者大会 2022

产业联盟的建立一方面促进合作伙伴基于已有大模型孵化更多行业应用,让大模型真正赋能产业;另一方面大模型得到了行业更丰富数据、和更泛化应用场景的反哺,由此带来基础能力的不断提升,让大模型更智能、更适配应用场景。

参考链接:

https://www.mindspore.cn/largeModel/taichu

https://www.mindspore.cn/largeModel/pangu

https://www.pcl.ac.cn/html/943/2021-09-26/content-3858.html

http://www.caict.ac.cn/english/research/whitepapers/202203/P020220322344729036910.pdf

MindSpore官方资料

官方QQ群 : 486831414

官网:https://www.mindspore.cn/

Gitee : https : //gitee.com/mindspore/mindspore

GitHub : https://github.com/mindspore-ai/mindspore

论坛:https://bbs.huaweicloud.com/forum/forum-1076-1.html 

这篇关于内修昇思MindSpore AI框架,外重行业汇聚,华为大模型的不平凡之路的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/422315

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验