他们带着大模型,到行业原野中去

2023-12-18 09:20
文章标签 行业 模型 原野

本文主要是介绍他们带着大模型,到行业原野中去,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

8d2dae54cc832d0b7c3b4f66f0e22fe5.jpeg

每隔一段时间,都会重读一遍梁启超先生的《少年中国说》。

在向科技要答案的时代,在技术创新愈发可贵的时代,这篇我们都学过的文章中蕴含着极大的价值。比如,其中说“使举国之少年而果为少年也,则吾中国为未来之国,其进步未可量也”。每一项技术都是初生的少年,但这些技术创新真的有少年心气吗?

我们的技术,是否真正心怀宽广,愿意进行根技术的全栈创新?

我们的技术,是否愿意走出家门,步履四方,去了解应用场景,去洞察行业需求?

我们的技术,是否能与大势相结合,承担起自己的时代责任?

在大模型掀起的新一轮全球AI热潮中,这些问题的答案变得尤其重要。几个月以来,中国已经陆续发布了数十款大模型。但总有网友在问这样一个问题:中国做了这么多大模型,究竟有什么不一样?

我们是该坚持“人有我也有”的老成稳重,来亦步亦趋做AI ,还是要积极与这片土地结合,做出“人无我有”的新智能?

680fd9009fcc839a033b99fe2091b3c8.png

如果你的答案也是后者,那么盘古大模型3.0值得了解一下。

在7月7日举办的华为开发者大会2023(HDC.Cloud 2023 )期间,华为云发布了盘古大模型3.0。与其他AI大模型不同的是,华为云选择去到行业原野里,写一篇「少年AI说」。

AI大模型

需要一些少年气

c3ac5a00203695a3d7fd564c3d2c3486.png

梁启超在《少年中国说》里讽刺了一种暮气沉沉的现象,“虽轰雷盘旋其顶上,他事非所顾也,非所知也,非所闻也”。

技术创新中,经常也会陷入类似状况:一项技术火了,大家就一拥而上,只要能够做出差不多能够交差的东西就行。在第三次AI崛起已经超过十年的今天,这种暮气已经显现出来。比如说,AI大模型通用性好,泛化性强已经成为产业共识。但大模型的应用,目前还处在比较传统的轨道上——写写诗,答答题,跑跑分,刷刷纪录。模式上看,这与深度学习十年来的应用逻辑只有量变,缺乏质变。

当大模型遇上如火如荼的数字中国建设,无数企业会问:亭台楼阁中的大模型很好,但我的行业为什么用不到?

中国大模型想要发展,必须要直面并回答这个问题。

29aaa80436aa7e62613ac0ce81fb06e6.png

综合来看,目前产业与大模型结合的门槛依旧很高,集中表现为以下几个方面:

1.AI技术本身门槛高,成本高。从算力成本、数据成本、开发成本、人才成本多方面,企业应用AI并不容易,这为大模型落地造成了基础阻碍。

2.数据安全和基础设施隐忧。大模型是企业的核心数字化资产,需要得到核心技术、数据应用方面的多维度保障。尤其是AI大模型的技术自主化水平,在全球环境中正变得愈发重要。

3.大模型缺乏与行业结合的必要节点。行业应用大模型,不仅需要模型的通用性与泛化性,还需要模型具备专业知识,具备行业技能。

怎么克服这些挑战?答案不在办公室、实验室里,而在广袤的大地上。我们必须要像少年一样走出去,走到行业当中,走到原野当中才能看见问题,找到答案。

今天的中国,数实融合成为了产业经济的大势所趋。中国经济的优势是行业众多、产业体系全面,各行业的数字化、智能化动力蓬勃强劲,以东数西算为代表的国家级数字化基础设施快速发展。

大模型必须与这些优势、需求结合,才能创造革命级的科技生产力,激活千行百业的深层价值。

从2021年发布以来,盘古大模型一直在思考客户运营、产品研发、软件工程、生产供应、市场营销等行业客户真正关注的问题。“不作诗、只做事”的盘古大模型,凭借一股活泼生动的少年气,走向了行业原野。

be0fbe95a2f11a7b59c5eb5933e934a5.png

到行业原野中去

盘古大模型3.0有何不同?

在华为云“AI for Industries”的思路下,结合时下产业界最关注的大模型能力趋势,盘古大模型3.0实现了一系列升级,围绕“行业重塑,技术扎根,开放同飞”三大方向,持续打造核心竞争力。

HDC.Cloud 2023当中,全面展示了盘古CV大模型、盘古预测大模型、盘古科学计算大模型、盘古NLP大模型、盘古多模态大模型五大基础模型,并且发布了系列行业大模型,其中包括政务、金融、制造、轨道行业大模型。

4c446bb8c5e2227dd4b58f426e0ca0fd.png

在技术差异化层面,盘古大模型3.0包含一系列新技术特性。

其中最为外界关注的大语言模型与多模态模型领域,盘古3.0可以提供100亿参数,380亿参数,710亿参数和1000亿参数的系列化基础大模型,匹配不同场景、不同时延、不同复杂度的行业需求。而这些模型可以提供一致的能力集,包括大语言模型的知识问答、文案生成、代码生成、NL2SQL、插件调用等外界十分关注的能力,以及多模态大模型的图像生成,图像理解等能力。

在应用结构层面,盘古大模型3.0构筑了完全面向行业提供服务,以行业需求为基础设计的大模型体系,包括5+N+X三层架构,即5大L0层的基础大模型,能够提供通用技能,支撑企业的各类应用;N个L1层的行业大模型,能够基于基础大模型的多种能力组合,帮助企业通过数据微调打造符合自身需求的大模型产品;X是海量的L2层场景模型,场景模型更加专注于某个具体的应用场景或特定业务,为客户提供开箱即用的模型服务。

在这三层结构的加持下,盘古大模型3.0可以适配企业的各种需求,并通过多样、灵活的组合排列,形成符合千行百业需求的“千面大模型”。

盘古大模型3.0,究竟为何能深入行业,立足行业?这个问题,需要我们记住三个关键词。

红日初升,其道大光

大模型背后的行业沉淀

08d2f59773b2fda7b8669ca100a907ff.png

第一个关键词:行业经验。

所谓“了解行业”,并不是某种标准化能力,而是无数技术体系、产业体系搭建成的经验集成。积累行业经验没有捷径,而是必须一个个场景深入进去,一个个案例钻研下去,去矿山,去码头,去实验室,才能用水磨功夫聚集起行业经验。

依托华为行业军团,华为云沉淀了超过400行业解决方案,并和伙伴联合打造7大行业aPaaS,从而真正沉淀各个行业的核心诉求、核心知识、核心能力。在AI方面,华为云AI已经在各行业有超过1000个项目的合作经验,对各个行业的智能化诉求有具体、细致的了解。而在华为云AI for Industries的大方向下,我们可以看到盘古大模型本身即与行业知识深度结合,学习了10多个行业公开数据,涵盖金融、政务、气象、医疗、健康、互联网、教育、汽车、零售等,在每个行业板块中学习了超过500亿 tokens的数据量。

行业种类众多、涉及合作规模庞大、行业数据量巨大的行业经验,最终造就了盘古大模型在行业原野上的“其道大光”。

以矿山大模型为例,让煤矿工人在办公室中进行远程操作,是煤矿智能化发展发展的重心。但远程操作会面临矿井内大量粉尘、水雾遮挡摄像头,弱化监控效果的问题。面对这个难题,盘古大模型可以将超过100路视频拼接在同一个画面上,通过透尘算法,异物检测等视觉大模型技术,实时识别采掘过程中的大块岩石、大块煤、煤仓卡堵等异常情况,从而实现地面工作人员不下井,就能在看清看准的情况下实时操控采煤机作业。

目前,基于盘古矿山大模型,华为云与山东能源集团深度合作,开发了21个场景化应用,覆盖能源行业7大业务系统盘古大模型的成功应用,让煤矿工人工作环境更加舒适安全,极大提升了矿山行业的生产效率与安全水准。

行业沉淀不是朝夕之功,而是经年累月的融合与突破。盘古大模型能够真正融入行业,是因为它一早就为行业而生,而且在这条路上躬耕良久。

b957fd45c9a605e8e51dd54f87ab8ba3.png

乳虎啸谷,百兽震惶

自主创新的AI时代

第二个关键词:自主创新。

在当前局面下,科技自立自强已经成为国家战略,行业所需,尤其在涉及国计民生的重点行业,在面对大模型机遇时候对其自主创新水平提出了新的需求,也只有走向全栈自主创新,才能够满足这些行业的智能化需求,真正让AI进入行业原野。

为此,华为云盘古大模型在算力、芯片使能、AI框架、AI平台实现全栈自主创新。华为在最底层构建了以鲲鹏和昇腾为基础的AI算力云平台,以及异构计算架构CANN、全场景AI框架昇思MindSpore、AI开发生产线ModelArts等,为大模型开发和运行提供分布式并行加速,算子和编译优化、集群级通信优化等关键能力。基于华为的AI根技术,大模型训练效能可以调优到业界主流GPU的1.1倍。

f7cf35c07251fa511151d1f402956f20.png

(华为常务董事、华为云CEO张平安)

同时,华为云还积极推动大模型事业与东数西算战略进行结合,会上,华为常务董事、华为云CEO张平安宣布单集群2000P Flops算力的昇腾AI云服务在华为云的乌兰察布和贵安AI算力中心同时上线。昇腾云服务可以提供更长稳的AI算力服务,千卡训练30天,长稳率达到90%,断点恢复时长不超过10分钟。

随着AI技术的发展,社会经济的智能化跃升尽在眼前,而自主创新是这个时代不可规避的核心使命,打造世界AI另一极,成为了华为云的责任,也成为了中国科技的机遇。

前途似海,来日方长

以可用性为路标的AI云服务

56b8418a8973d84f88a13c2d4652086b.png

第三个关键词:真实可用。

大模型的行业落地,需要面对一系列复杂的环境挑战、人才挑战、商业挑战。克服这些难题,不仅需要技术能力的提升,更需要在各个环节提升大模型的易用性,降低产业智能化门槛。对此,我们不能闭门造车,想当然地发展AI、发展大模型,而是需要走到真实的产业需求、开发者需求当中去。

为此,华为云以可用性为路标,构筑了一系列真实可用的AI云服务。比如我们上面讨论的大模型商业模式,就通过L0、L1到L2的三层模式,全面打通了大模型的商业模式问题,解决了企业用户在大模型专属性、订制化方面的难题。

除此之外,华为云应对企业不同的部署需求,提供了包括公有云、公有云大模型专区、混合云等多种部署模式,从而满足不同类型企业对大模型的部署需求。

在大模型的开发友好度方面,华为云提供了易用可靠的大模型工具套件、汇聚海量多行业场景API的开天aPaaS,以及包含丰富优质课程和技术认证的大模型专属社区,希望与开发者及伙伴一起,共同探索盘古大模型与行业结合的创新路径。

8b8ddcba03261fac442ad0ba8ca505be.png

《少年中国说》中提到,“少年智则国智,少年富则国富,少年强则国强,少年独立则国独立”。AI大模型技术处在国际战略与产业革命的关键赛点上,对于社会经济的数实融合、智能化升级来说,大模型扮演着“AI强则科技强,AI独立则科技独立”的角色。

这时候,我们需要勇于承担责任,敢于探索未知的大模型体系。AI需要到行业知识中去,到自主创新中去,到开发者身边,到企业内部,到一间间工厂中去,到一座座矿山中去。走向原野,锐意拼搏,成为少年AI。

盘古大模型的目标,是要帮助每家企业、每个人都拥有自己的专家助手。最终,每家企业,每个行业的AI之力涓滴成海,才能汇聚成年少有为的智能中国。

纵有千古,横有八荒。前途似海,来日方长。

只有闯出去,做实事,才能让AI技术与天不老,与国无疆。

a009c6d498ee7dd7724aa254ece2a395.gif

这篇关于他们带着大模型,到行业原野中去的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/507887

相关文章

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU