大模型时代,AI三巨头商汤、旷视、讯飞逐鹿智驾

2024-04-19 21:44

本文主要是介绍大模型时代,AI三巨头商汤、旷视、讯飞逐鹿智驾,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

作者 |张马也

编辑 |德新

d96e6a6c83fabac45a70dc4477a4c460.jpeg

2024年的智驾竞争已经处于收敛的阶段,但仍有新的巨头进入这一极度内卷的赛道。他们是商汤、旷视、科大讯飞等以算法见长的AI平台公司

中国电动汽车百人会论坛上,小鹏汽车董事长何小鹏说,上一个十年是新能源的十年,下一个十年将是智能化的十年。

汽车智能化水平对消费者的吸引力越来越强,已经成为车企全力打造的差异化能力。面对这一趋势,车企为了保持产业的领先地位,通过自研、收购等方式构建智能化核心竞争力;以地平线等为代表的新兴公司早已深耕多年,终于迎来收获季;传统Tier1巨头同样不甘落后,加速布局智能化核心技术。

现在,又有新的力量开始崛起。这几家公司长期以来一直蛰伏一旁,但由于市场不明朗,只是保守跟随,或者做一些预研性的研究。

比如商汤,早在2016年,市场普遍对L4级智能驾驶抱有极大热情和期待的时候,就已开始参与本田自动驾驶项目。但之后的几年,除了一些展示性的项目,鲜有商业化落地。

2021开始,事情发生了变化。

  • 商汤成立智能汽车事业群,对外发出了更强烈的信号;
  • 旷视也在同一年将智能驾驶上升为重点业务;
  • 2022年上半年,讯飞的智能驾驶子公司浮出水面。

一、为什么是这个时间点?

从技术上来讲,这几家公司所擅长的AI算法,一直是智能驾驶的核心,尤其是感知所依赖的计算机视觉。各家的创始团队也均有浓厚的学术背景。

但在此前,纯AI公司入局智能驾驶,所面临的一大挑战是硬件平台多样化,包括不同的芯片平台和传感器类别。

这让以算法见长的AI公司难以用一套软件去适配各种硬件,也导致不得不在不同的有定制化需求的项目中奔波,而且往往安全性达不到要求。

除此之外,成本也是重要因素

一开始,为保证行车安全,智能驾驶的路线是多传感器融合,配置大算力芯片,很难满足车厂的低算力低成本要求。要知道,传统汽车厂商的营业利润率一般在5% - 10%之间。

f5a1a5617c8e715e1bee21ad5edb43ea.jpeg

直到2020年,特斯拉首次提出BEV算法,成功用8个摄像头的数据实现了NOA功能,让纯视觉路线的智能驾驶得到了验证,也让成本变得可控。

均胜电子副总裁郭继舜曾在HiEV的直播栏目中表示,BEV诞生后,很多公司开始去提出基于BEV去做各种传感器的训练,然后得到了一个BEV平台,之后可以在上面去适配更多不同像素的摄像头、不同角度的摄像头,不同原理的激光雷达或者是3D、4D毫米波雷达。

这种新的范式让硬件的改变,给软件和算法带来的障碍大量减少,这就给了AI公司更多的机会,毕竟在智能算法上他们更擅长。

二、商汤绝影:高举高打形成飞轮效应

商汤在智能驾驶上的布局较早。

2016年,自动驾驶热潮正盛之时,商汤开始参与本田自动驾驶项目,两家公司在2017年签订长期合作协议,共同研L4自动驾驶技术,由商汤提供视觉感知技术以及用于自动驾驶的芯片和嵌入式系统。此后,在日本常总市、中国杭州及上海临港等地,建立了自动驾驶测试基地,在半开放的道路上做自动驾驶演示。

商汤每年在CVPR、ICCV等学术会议上关于自动驾驶的论文不少,也多次获得智能驾驶相关的学术比赛冠军,并在2023年凭借UniAD端到端自动驾驶大模型的论文获得CVPR最佳论文

2019年9月的世界人工智能大会上,商汤发布了“商汤智能驾驶量产解决方案”和“商汤科技自动驾驶解决方案”。

a5a3ac19bda98092c8d7a9569a2e2ef6.jpeg

而首款搭载商汤ADAS高级辅助驾驶解决方案的车型,是合众旗下哪吒汽车的第3款量产车哪吒V

不过此时的ADAS方案,主要是预警类功能,比如车道偏离预警、前车碰撞预警等,还没能实现对车横向亦或者纵向的控制。可以说,这几年中商汤汽车业务以智能车舱为主,智能驾驶方面以探索为主,缺少商业化的案例。

到2021年的WAIC世界人工智能大会上,商汤绝影正式面世,随后商汤成立智能汽车事业群,智能汽车业务业务的地位直线上升。

商汤汽车业务由公司联合创始人之一的王晓刚亲自带队,团队规模在1000+人。

商汤在AI领域向来高举高打,在汽车业务上也不例外,主要产品包括车舱、量产智能驾驶、自动驾驶功能车、车路协同、基础平台引擎等。

1bfebbd0580ca7c22b42b279f6a190ef.jpeg

这样策略虽然在研发及基础设施上的投入较大,但可以让业务获得更多前沿技术的支持,特别是在大模型时代,这一点至关重要,而且多样化的业务需求可以摊薄研发成本。

面对智能驾驶这一快速增长的市场,商汤希望通过这样的方式形成自己的飞轮效应。

这一点在财务数据上还只是初现端倪。

根据商汤2023年年度财报,汽车业务收入3.837亿元,其中智能驾驶相关收入的增长功不可没。虽然汽车业务仅占总收入的11.3%,不过同比增长31.1%,相比于传统的AI业务,涨势尚可。

目前商汤已经在广汽埃安LX Plus、哪吒S、广汽昊铂GT等车型的高速NOA量产,今年将实现城市NOA量产

其中,哪吒S的智驾功能已经在今年2月通过OTA升级正式上车,基于16 TOPS算力域控平台和5R11V传感器配置。

哪吒S的项目,是基于双 TI TDA4 VM的高速NOA方案。TI TDA4系列芯片高性价比,但算力较小,在这个基础上量产稳定的高速NOA功能有很强的工程能力挑战,市场上能做的厂商不多。

除了大疆车载和百度苏坦率领的ANP2团队外,目前只有商汤绝影作为少数团队量产了这一方案。这个也是商汤绝影在算法能力之外,在工程能力上获得的比较大的认可。

目前商汤市值在200亿港元左右,已经低于部分未上市的自动驾驶公司的估值。谁高估、谁低估暂且不论,智能驾驶业务必定会给商汤带来不错的业绩加成,对市值提升有积极意义。

三、旷视:追求极致性价比

2018年11月,旷视曾公开展示过车载AI视觉解决方案,也是以车舱为主,比如基于车载系统和驾驶过程的人脸解锁、账户切换、驾驶员识别、多模态交互等功能。在2021年公布的招股书中,也没有太多与智能驾驶相关的信息。

直到2023年,旷视才对外透露了智能驾驶领域的最新进展。

根据此前的采访,旷视认为基于雷达+视觉的传统算法,不可能解决高阶智能驾驶问题的,而自己的优势又集中在计算机视觉算法,因此一直选择观望,等待一个技术层面的突破。这种局面在BEV算法验证成功后被打破。

于是2021年初开始,旷视正式重点开发智驾方案

目前,旷视有一个独立的智驾团队,在数百人左右,其中三分之二是研发人员。主要负责人是刘伟,他曾担任SAP全球副总裁,微软渠道事业部总经理。

作为后来者,旷视智能驾驶方案走的是一条性价比的道路,也就是将相同技术指标要求的硬件成本尽可能降低,强调量产和规模化的辅助驾驶方案。

2f2eef35581f49e0ecb4560eea469c25.jpeg

图片来源: https://www.smartautoclub.com/en/p/58391/

此前,不少车型采用了英伟达自动驾驶芯片OrinX来跑高阶辅助驾驶,比如蔚来ET7、小鹏G9、智己LS7等,其中单颗Orin-X芯片价格在400美金左右。而旷视透露,其对于BEV算法的实现,可以做到在只有Orin芯片1/5甚至1/6算力(也就是几十T级别)的嵌入式芯片上跑通。

为控制成本,旷视在高中低不同定位的车型上,都采用统一的BEV算法框架,做到算法平台化、硬件平台化,并去高精地图、去RTK、去激光雷达。在适配不同算力的芯片时,旷视采用Pin-to-Pin的系列芯片(芯片功能脚相同即可以互换),从而缩减硬件切换成本,提高量产速度。据称,旷视智驾方案在行业中至少降本20%

目前,旷视的方案包括标准版、专业版、旗舰版,分别对应10-15万元车型、15-30万元车型和30万元车型,主要发力点也在标准版和专业版方案上。这种策略也与智能驾驶功能逐渐下放到廉价车型上的趋势相符。

最基础的标准版就能实现高速NOP功能,可以覆盖高频智驾场景,主打性价比。专业版可进阶实现城市NOP和跨车道安全停车。最高配置的旗舰版具备增强的城市NOP功能,具备更强的安全冗余。

HiEV获知的消息是,目前旷视正基于黑芝麻A1000的芯片为吉利的一款车上推进智驾方案量产。

四、讯飞:国产化方案,优先服务安徽车企

在汽车领域,科大讯飞虽然开展了多年的布局,并在与奇瑞、江淮集团等的合作中,也提及过自动驾驶产品开发,但此前主要为汽车行业提供智能语音交互产品和解决方案,而且其合作厂商几乎囊括了国内外主流的汽车厂商。

直到2022年5月,讯飞在无锡成立智能驾驶科技总部公司,其智能驾驶相关的信息才浮出水面。这家公司的定位是Tier 1,主要负责智能驾驶域控制器等相关软硬件产品的研发、销售和综合解决方案运维、以及车联网和智能网、智能网联汽车研发。

2023年的发布会上,讯飞发布了两款行泊一体智驾解决方案智驾STD和智驾PRO,前者的配置是5颗毫米波雷达+6颗摄像头、算力15+TOPS、可实现包括高速NOA、自动泊车、确认式变道等功能;后者包括5颗毫米波雷达+11颗摄像头、算力50+TOPS、可实现增强型高速NOA、确认式变道、记忆行车灯功能。

8a860106f382614fe824bc7ae7fcc6ed.jpeg

图片来源:https://it.sohu.com/a/732238076_118790

目前还不确定讯飞智驾方案未来会搭载的车型,但其产品定位是追求性价比当属比较确定。在发布会现场,奇瑞、长城、广汽、一汽红旗等诸多企业也均有为讯飞站台。

讯飞在2023年的季度财报中曾披露,智能驾驶方案在硬件层面已实现多款基于国产芯片的域控制器样件开发,采用行泊一体、可扩展架构的L2+全功能已完成实车测试验证,预计2024年上半年量产交付

据HiEV了解,由于江淮汽车与科大讯飞、黑芝麻科技均有战略合作关系,讯飞与黑芝麻在智能驾驶技术研发方面有深度的合作,正在做基于黑芝麻A1000芯片的智能驾驶方案。同时,讯飞也在尝试地平线的J6芯片中。

讯飞智驾团队隶属于智能汽车事业部。团队负责人是李卫斌,曾任江汽集团技术中心副主任、智能网联汽车研究院院长,江淮思皓首款搭载L2+级自动驾驶功能的量产车型,就是在其任职期间问世的。2023年讯飞智驾团队的体量约在100多人。

截至2023年中,讯飞的智慧汽车业务收入在2.1亿左右,占总收入的2.72%,全年的整体收入应该仅略高于商汤,而商汤汽车业务的员工应该在1000+人。

以此推测,讯飞智能驾驶业务大概率优先服务于安徽本地车企,如合作方江淮与奇瑞。

五、大模型带来新机会

目前,智能汽车已经进入下半场,随着越来越多玩家的加入,2024年很可能是智能驾驶方案商的“内卷”元年。

在百家争鸣的时代,商汤、旷视、讯飞这几家有一定规模的上市及准上市公司,正在用多年的AI技能改变汽车行业的格局

更进一步,大模型的出现,进一步推动着局面的变化。智能驾驶也好,智能座舱也好,它的软硬件架构,包括产品的形态也都会因为大模型的出现受到极大的改变和冲击。

根据商汤王晓刚的说法,当前自动驾驶的系统里面会有很多模块,其中只有感知模块是基于人工智能和神经网络的,而剩下其他模块大量是靠着手动编写规则来实现的。随着自动驾驶从高速走向城区,其复杂程度大幅提升,必然会走向端到端的,基于大模型的智能驾驶。

这种新的形势,正在给AI公司带来新的机会。

但同样值得注意的是,智能驾驶从研发到技术成熟,再到产品上车,验证技术,需要经历很长的时间。

而且随着未来智能化能力向低价车型下放,这也会进一步压缩智能驾驶方案的利润空间,在激烈的竞争中,智能汽车业务对AI公司来说,是一块新的沃土,还是一片沼泽地,现在还无法定论。在诸雄争霸中,谁都会认为自己是下一个王者。

参考资料:

http s://www.gov.cn/lianbo/bumen/202309/content_6905530.htm

https://car.tom.com/202310/1084818867.html

https://www.21jingji.com/article/20230420/herald/1e8353ae50ff9f8e6ea99f70c8840758.html

https://baijiahao.baidu.com/s?id=1733442488951056748&wfr=spider&for=pc

https://36kr.com/p/2274018101485958

https://www.dongchedi.com/article/7268178202470908468

这篇关于大模型时代,AI三巨头商汤、旷视、讯飞逐鹿智驾的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/918524

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费