“群模时代”,国产AI大模型的进击

2024-06-10 20:12

本文主要是介绍“群模时代”,国产AI大模型的进击,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

近期,国内多款大模型重磅消息不断。

1

3月,月之暗面的Kimi升级迭代后,长文本能力达到尚未上线的GPT-4.5Turbo的10倍。

2

4月,商汤科技发布的“日日新SenseNova”5.0多模态大模型在主流客观评测上,中文理解、知识储备、数理逻辑、代码编程等方面的能力就达到了GPT-4Turbo。

3

5月9日,阿里云发布通义千问2.5,据称“在中文场景模型性能赶超GPT-4-Turbo”,同时1100亿参数开源模型在多个基准测评收获最佳成绩。

4

5月15日,字节跳动正式发布“豆包大模型”,这也是国内又一家互联网巨头发布的自研大语言模型。据介绍,豆包大模型目前日均处理1200亿Tokens(表示和传递信息的标识符)文本,生成3000万张图片。

此外,从各项指标测评来看,国内部分自研大模型亦表现亮眼。近期,全球增长咨询公司沙利文发布的《2024年中国大模型能力评测》对国内主流的15个大模型进行了横评,其中,百度、腾讯、阿里等互联网大厂旗下大模型位于第一梯队,综合表现更为优异。而百度文心一言能力最为全面,五项评测维度均为优势能力,并取得四项第一。

图片

上述种种,说明国内领先的大模型企业已取得了显著的进步,成功缩小了与国外先进水平的差距。

这让我们有理由相信在“百模大战”的下半场,会如近期腾讯研究院发布的《向AI而行,共筑新质生产力——行业大模型调研报告》中所说那样,在“人工智能+”政策指引下,随着国产大模型能力的提升,行业大模型将加速落地,向多模态、AIAgent等方向发展。这就像是AI界的“未来城市”,充满了无限可能。

01

AI大模型的中国竞速

如今,国产AI大模型已狂飙突进有一年时间。

2023年,在ChatGPT爆火之后,大模型技术迅速在全球科技界掀起了一场风暴,引发科技巨头们的激烈角逐。国内的科技大厂、中小企业、科研院所亦纷纷入局,当百度“文心一言”打响“大模型的第一枪”后,阿里巴巴“通义千问”、华为“盘古”、360“智脑”、昆仑万维“天工”、京东“灵犀”、科大讯飞“星火”、腾讯“混元”、商汤“日日新”等一大批大模型陆续登场,拉开了国产大模型进击的序幕。

图片

据了解,目前市场上的AI大模型按照部署方式进行划分,主要分为云侧大模型和端侧大模型。与云侧大模型主要面向产业化应用需求不同,端侧大模型主要服务于个人用户。

毫无疑问,在这场空前的科技浪潮中,随着多家科技厂商推出AI大模型并落地商用,各类通用、行业以及端侧大模型在多个领域取得了显著的成果,初步形成多元化的产业生态。

在通用AI大模型方面,极具代表性的大模型产品如百度“文心一言”、阿里巴巴“通义千问”等具有强大的自然语言处理能力,可以应用于多个领域,包括但不限于智能客服、智能写作、知识问答等。

图片

在行业AI大模型方面,蜜度的文修大模型、容联云的赤兔大模型、用友的YonGPT大模型等都是各自领域的佼佼者。这些大模型针对特定行业的需求进行了优化和定制,能够提供更加精准、专业的服务。例如,YonGPT大模型深耕企业服务领域,通过智能化业务运营、自然化人机交互、智慧化知识生成和语义化应用生成四大方向,为企业提供全价值链、全场景的泛在智能应用。

在端云结合的AI大模型方面,vivo的蓝心大模型是其中的代表。蓝心大模型是首个在手机端运行的开源大模型系列,通过矩阵化部署适应不同应用场景,为手机用户提供智能化服务,如智能创作、知识问答、角色扮演等功能。这种端云结合的方式使得AI大模型的应用更加广泛和便捷。

在端侧AI大模型方面,蔚来的NOMIGPT大模型是一个典型的例子。NOMIGPT大模型是蔚来汽车推出的智能语音助手,具有强大的自然语言处理能力和多模态交互能力,能够为用户提供更加智能、便捷的驾驶体验。

尤其进入2024年以来,又有多重利好因素推动着国内大模型产业快速发展。首先是“人工智能+”行动等来自政府层面的有力支持,其次用户提升生活、工作效率的需求激增,再就是科技公司加大对AI领域投入资金、人力、技术研发。据国家网信办今年4月发布的公告显示,目前我国已有117个大模型完成生成式人工智能服务备案。

对此,有相关机构指出,这一势头表明国产AI大模型不仅在技术层面取得了突破,更在商业应用和推动社会生产力变革方面展现出巨大潜力,但同时也要看到,真正的爆款应用尚未出现,国产大模型要真正走到规模化部署依然道阻且长。

02

深耕行业、落地行业的

企业级大模型或成最优解

一项全新的技术要切实在生产生活中发挥作用,应用的场景尤为关键。

如果说2023年是AI大模型市场的百“模”争鸣,那么2024年则将成为国产大模型全面商业落地的元年,进入赋能千行百业的关键期。因此,如何将大模型与产业化应用无缝连接,并把大模型以高效低成本方式落地到千行百业,就成为大模型企业亟待突破的方向和自证价值的考场。

图片

有业内人士指出,目前来看,现在问世的更多是通用大模型,这类大模型具备强大的自然语言理解、语言生成和语音识别等能力,在聊天、娱乐等通识属性较强的场景上表现颇佳,但这些场景目前还难以实现大规模商业化。而在细分的产业场景上,通用大模型回答准确度较低,这是因为产业本身数据样本量较少、数据分布不均、应用场景多变,导致大模型无法进行自我优化和改进,输出精度自然不高。因此,从商业化落地来看,企业或许并不需要一个“全能”的通用大模型,而是更需要针对细分领域场景、解决实际问题的产业大模型。

图片

中国工程院院士邬贺铨表示,“我们需要去深入思考大模型的应用方向,要将大模型切实投入到城市发展、金融科技、生物医药、工业制造、科学研究等领域,也需要专业的企业和组织加速其在实体产业落地,为产业刚需带来实实在在的价值,真正意义大规模服务社会。”

百度创始人李彦宏亦深刻指出:“单纯地追求大模型的规模与复杂度,并无实质性的意义。真正有价值的,是将这些技术应用于实际场景中,发掘出更大的商业机会。”

腾讯高管汤道生则表达了类似的观点:“大模型只是我们探索AI世界的起点,真正的未来在于它如何与各行各业深度融合,实现技术的落地应用。”

通过多位专家的见解,可见大模型落地终究还是要回归产业、回归真实场景、解决实际问题,才是技术的最终归宿,也是大模型良性发展的开端。

而有相关机构也指出,我国AI大模型的发展正处于多元并行的技术突破阶段,在这一过程中,对趋势的把握将成为众多参与者破局的关键。由此看来,在国际人工智能竞争愈发激烈的当下,对于已入局的众厂商而言,除抛开基础层面的较量外,能率先在赛道里抢到更多筹码的应该是在各行各业的切实落地上。

03

多维着力培育大模型发展沃土

图片

2024年1月30日,科大讯飞举行星火认知大模型V3.5升级发布会——全国产化算力平台“飞星一号”、讯飞星火V3.5、语音大模型、星火开源-13B等产品接连亮相的同时,科大讯飞亦端出了诸多大模型商业化成果。

日前,阿里云接连发布多个关于行业大模型落地的消息。例如,与中国科学院国家天文台人工智能工作组共同打造了新一代天文大模型——“星语3.0”、中国一汽基于阿里云通义千问打造了汽车行业的首个大模型BI应用、基于阿里云通义大模型打造的国内首个民航机场大模型应用正式上线、西安塔力科技通过接入阿里云通义大模型实现了大模型在矿山场景中的首次规模化应用等。从阿里云的实际动向不难看出,其正加快行业落地的步伐,同时,也体现出阿里云“通义千问伙伴计划”正在持续输出实际效益。

可以说,2024年以来,一系列大模型落地案例让我们看到了“AI+”的广阔想象空间,也了解了大模型的真实提效价值,但根据业界多位专家的公开发言可知,除了目前大模型自身仍然存在的缺陷外,随着竞争的逐渐激烈,我国大模型产业化在相关数据、算力、算法等方面的困境也逐渐暴露,同时在安全可控、隐私保护、伦理偏见等方面也面临挑战。

360创始人周鸿祎曾在接受相关媒体采访时表示,虽然公开的大模型是通用的,甚至是万能的,但是当深入到具体行业时仍然面临着缺乏行业深度、不懂企业内部知识、易导致企业内部数据泄露、无法控制成本等问题。

与此同时,中国工程院院士、紫金山实验室主任刘韵洁表示,“近期,大模型在全球范围内不断涌现,但我国的通用大模型已经落后于美国。其中一大主要原因就是数据,美国有全球数据资源方面的优势。我国的机会,是行业大模型,因为与实体经济紧密相关,但前提是要把行业的大数据利用好、管理好、保护好。”

华为混合云副总裁胡玉海认为,大模型需要行业高质量的数据作为输入才能发挥价值,但现在很多企业的业务建设比较分散,数据的共享和汇聚挑战很大。业务的分散,也使得大模型生成后落地效果受限。同时,大模型算法的调优依赖于人才的能力和经验,我们目前的人才相对来说比较匮乏,这可能使得大模型产生价值的周期变长,使得大模型落地的门槛变高。

图片

“我国人工智能大模型走向实践,还需妥善解决算力资源配置、数据开发利用、人工智能立法等关键性问题,让这些‘根’技术足够坚韧。”在西南政法大学人工智能法学院院长陈亮看来。

如何充分用好现有大模型基础,发挥场景优势,形成通用人工智能的产业生态,各行业都还在积极探索之中。

图片

在今年两会期间,各界代表委员们的提案从不同角度给出了意见参考。比如中国科学院计算技术研究所研究员张云泉建议集中AI芯片研制力量突破算力瓶颈。还有一些企业代表从发展生成式AI教育、建立AI数据交易市场等方面提出建议。作为大模型国家队的重要参与者,科大讯飞董事长刘庆峰从系统性出发,建议加快制定国家《通用人工智能发展规划》,建议围绕自主可控算力生态构建、高质量数据开放共享、科学的评测标准制定、源头技术前瞻研发、人才培养等维度打造优势。综合这些代表的建议,可以看到,无论是着眼人才、算力还是应用、系统规划,当下产业的一大当务之急,无疑是要打造国产大模型应用生态。

同时,行业主管部门也一直在思考。工信部指出,下一步大模型技术发展最主要的一个侧重点是在生产领域的应用。这将是国际竞争非常激烈的一个新赛道。我们要以人工智能和制造业深度融合为主线、智能制造为主攻方向、场景应用为牵引,统筹布局通用大模型和垂直领域专用模型,从供需两端发力,营造创新生态,高水平赋能新型工业化。要加大创新投入,夯实算力、算法、模型、数据等技术底座,提升大模型性能水平。

AI大模型作为人工智能领域的重要里程碑,正引领着行业迈向一个新的发展阶段。面对挑战与机遇并存的未来,持续的技术创新、合理的政策引导以及跨界的紧密合作将是推动这一领域健康发展的关键。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

这篇关于“群模时代”,国产AI大模型的进击的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1049149

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费