智能座舱“试水”多模态交互

2024-02-16 03:20

本文主要是介绍智能座舱“试水”多模态交互,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一直以来,在智能汽车的舱内感知交互部分,汽车制造商的目标是打造一个对驾驶员及乘客有深刻理解、能够满足驾驶相关需求和非驾驶相关需求的个人助理。

从早期的语音交互,到驾驶员注意力监控、疲劳预警再到手势交互,这样的多模态交互系统与驾驶员辅助系统一起形成合力,帮助提升行车安全以及舱内的体验。

在高工智能汽车研究院看来,再加上AR HUD、生命体征监测、智能触控面板等其他舱内技术,结合多模态人机交互,意味着智能座舱进入真正的智能2.0时代。

这其中,基于语音、触觉、手势、视线追踪等多模交互技术已经进入新车前装量产的标配序列。同时,过去多家供应商提供离散功能的模式也被彻底打破。

高工智能汽车研究院监测数据显示,2020年国内市场新车7英寸及以上中控多媒体系统搭载率已经突破80%,4G联网搭载率已经接近50%,语音识别搭载率超过60%,1.0时代的数字座舱已经完成阶段性的前装覆盖。

一、

这一次,中国企业没有落后。

6月30日,搭载地平线征程汽车智能芯片及Halo车载智能交互方案的广汽传祺GS4 PLUS正式上市。背后是集成疲劳提醒、语音识别、视线检测、手势交互、表情识别等主动人机交互技术的量产落地。

在广汽,上述多模态人机交互技术结合ADiGO 4.0智驾互联生态系统,被命名为“超感交互智能座舱”,背后的合作伙伴包括华为、腾讯、科大讯飞、地平线、苏州智华、商汤、德赛西威以及马瑞利等供应商。

智能座舱“试水”多模态交互

同时,“超感交互智能座舱”基于G-OS操作系统、多屏联动、大屏娱乐系统、HUD抬头显示系统、空调和座椅全域控制等功能模块,实现全场景、全过程的沉浸式智能交互体验。

从目前公开信息来看,这套系统并没有搭载基于时下高端车型采用的座舱域控制器电子架构,但已经基本上构建了未来智能座舱人机交互的下一个阶段的功能部署。

智能座舱“试水”多模态交互

同时,这套系统的供应商组合,也再次验证了在量产系统中,如何实现人机界面组件(尤其是软件部分)模块化、高性价比的另一种实现方式,这降低对仪表、信息娱乐控制等传统硬件的复杂性要求。

在高工智能汽车研究院看来,接下来几年时间,座舱的电子架构部署将呈现多元化的市场格局。其中,整车智能中央域控制器、高度集成化的座舱域控制器架构、传统分布式ECU+智能交互控制器等模式都会并存。

尤其是10万级别车型,未来的智能化竞争日趋激烈。而不断增加的ADAS和智能座舱功能,在车企考虑成本的前提下,技术路线会更加偏向务实的策略。

同时,规模化量产,意味着背后的供应商需要能力更强的成本控制实力。

近日,Stellantis(PSA和FCA合并后)公司宣布与富士康联手成立了一家名为Mobile Drive的合资企业,联手开发智能座舱系统。除了背靠富士康的硬件成本控制能力,还有软件方面的功能交付,涉及语音、导航以及更多的车载应用功能。

“目前公司的汽车业务收入主要来自传统显示屏、机械和塑料部件,但我们将扩展到系统和模块层面。”富士康为此还打造了一个“开放电动汽车联盟”(MIH),目标是制定行业标准,并开发硬件和软件的“套件”,帮助汽车制造商削减新车的开发时间和成本。

而其中的关键部分,则是零部件的模块化,并集成为软硬件子系统。这种模式,意味着未来汽车智能化系统的模块化组装,就像智能手机一样,这可能会让供应商更有能力协同工作。

二、

“汽车驾驶舱正在发生变化。随着更多的显示器、摄像头、传感器和人工智能功能的加入,它变得越来越复杂。此外,车内和车外的界限越来越模糊,无缝的交互体验正在成为趋势,”大陆集团北美人机界面主管Jens Brandt表示。

在这个过程中,智能座舱的交互模式,也开始逐步从过去用户被动接受车机端提供的特定内容服务转向更多主动交互场景的部署。

以长安汽车UNI系列推出的首款车型UNI-T为例,搭载了与地平线(基于征程2芯片)联合开发的智能驾驶舱NPU计算平台,全方位实现车内场景化感知,并基于感知结果为用户提供更精准的智能推荐以及智能车控等服务。

例如,中控屏处于熄屏状态时,驾驶者注视屏幕1秒,屏幕即会自动亮起;乘员接听电话时,系统自动降低多媒体音量,保证通话清晰;识别到副驾乘员抽烟时,根据车速适度打开车窗并开启车内空气净化。

这意味着,座舱芯片的算力需要进行大幅提升。同时,针对座舱人机交互的特定需求,尤其是涉及到眼球跟踪、多模语音交互、多音区检测等视觉、语音和多融合算法的高效处理支持,也在重塑智能座舱异构计算的全新平台架构。

相对而言,类似恩智浦、TI、瑞萨以及高通这样的芯片公司,则更多“负责”多屏交互、底层系统稳定、虚拟化环境安全部署、支持导航、数字多媒体、云端互联等显示、联网类功能的落地。

去年,新的Cerence Drive 2.0发布,彻底改进了语音人工智能平台和Cerence云服务,日本丰田将率先量产搭载这一服务。还有新的Cerence Look,结合了在线数据库和视线跟踪摄像头,将汽车的语音助手变成实时导游。

全新的Cerence Look功能,已经搭载于梅赛德斯-奔驰最新一代MBUX上,驾驶员不需要使用特定的唤醒词,而是使用环境重建和传感器数据来确定车辆的位置,并确定驾驶员提出问题时正在看什么。

这是未来基于人机多模态交互的典型解决方案,涉及自然语言处理、手势识别和眼球追踪功能。此外,还有从现阶段相对成熟的双音区交互技术发展为四音区、六音区交互技术,可以让每个位置的乘客通过语音或其他交互方式控制各自的交互设备。

更进一步,就是基于情感化体验的智能主动式服务,也是语音交互的重要方向。通过多模态感知,基于用户行为、历史使用习惯、用车场景和时间等情况主动推送应用服务。

随着智能驾驶与座舱交互的融合度越来越高,还需要底层硬件能力的加持。比如,地平线已经推出的面向整车智能的征程5中央计算芯片,基于征程5的Halo5.0方案也即将发布,目标是集成自动驾驶和智能交互。

这篇关于智能座舱“试水”多模态交互的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/713341

相关文章

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

智能交通(二)——Spinger特刊推荐

特刊征稿 01  期刊名称: Autonomous Intelligent Systems  特刊名称: Understanding the Policy Shift  with the Digital Twins in Smart  Transportation and Mobility 截止时间: 开放提交:2024年1月20日 提交截止日

基于 YOLOv5 的积水检测系统:打造高效智能的智慧城市应用

在城市发展中,积水问题日益严重,特别是在大雨过后,积水往往会影响交通甚至威胁人们的安全。通过现代计算机视觉技术,我们能够智能化地检测和识别积水区域,减少潜在危险。本文将介绍如何使用 YOLOv5 和 PyQt5 搭建一个积水检测系统,结合深度学习和直观的图形界面,为用户提供高效的解决方案。 源码地址: PyQt5+YoloV5 实现积水检测系统 预览: 项目背景

【C++学习笔记 20】C++中的智能指针

智能指针的功能 在上一篇笔记提到了在栈和堆上创建变量的区别,使用new关键字创建变量时,需要搭配delete关键字销毁变量。而智能指针的作用就是调用new分配内存时,不必自己去调用delete,甚至不用调用new。 智能指针实际上就是对原始指针的包装。 unique_ptr 最简单的智能指针,是一种作用域指针,意思是当指针超出该作用域时,会自动调用delete。它名为unique的原因是这个

uniapp设置微信小程序的交互反馈

链接:uni.showToast(OBJECT) | uni-app官网 (dcloud.net.cn) 设置操作成功的弹窗: title是我们弹窗提示的文字 showToast是我们在加载的时候进入就会弹出的提示。 2.设置失败的提示窗口和标签 icon:'error'是设置我们失败的logo 设置的文字上限是7个文字,如果需要设置的提示文字过长就需要设置icon并给

单片机毕业设计基于单片机的智能门禁系统的设计与实现

文章目录 前言资料获取设计介绍功能介绍程序代码部分参考 设计清单具体实现截图参考文献设计获取 前言 💗博主介绍:✌全网粉丝10W+,CSDN特邀作者、博客专家、CSDN新星计划导师,一名热衷于单片机技术探索与分享的博主、专注于 精通51/STM32/MSP430/AVR等单片机设计 主要对象是咱们电子相关专业的大学生,希望您们都共创辉煌!✌💗 👇🏻 精彩专栏 推荐订

【C++】作用域指针、智能指针、共享指针、弱指针

十、智能指针、共享指针 从上篇文章 【C++】如何用C++创建对象,理解作用域、堆栈、内存分配-CSDN博客 中我们知道,你的对象是创建在栈上还是在堆上,最大的区别就是对象的作用域不一样。所以在C++中,一旦程序进入另外一个作用域,那其他作用域的对象就自动销毁了。这种机制有好有坏。我们可以利用这个机制,比如可以自动化我们的代码,像智能指针、作用域锁(scoped_lock)等都是利用了这种机制。

LLM系列 | 38:解读阿里开源语音多模态模型Qwen2-Audio

引言 模型概述 模型架构 训练方法 性能评估 实战演示 总结 引言 金山挂月窥禅径,沙鸟听经恋法门。 小伙伴们好,我是微信公众号《小窗幽记机器学习》的小编:卖铁观音的小男孩,今天这篇小作文主要是介绍阿里巴巴的语音多模态大模型Qwen2-Audio。近日,阿里巴巴Qwen团队发布了最新的大规模音频-语言模型Qwen2-Audio及其技术报告。该模型在音频理解和多模态交互

什么是LED智能会议一体机?COB超微小间距LED会议一体机大势所趋

LED智能会议一体机,作为现代会议室革新的核心装备,正逐步颠覆传统会议模式的界限。它不仅仅是一台集成了高清显示、触控互动、音视频处理及远程协作等功能于一体的智能设备,更是推动会议效率与体验双重飞跃的关键力量。随着技术的不断进步,特别是COB(Chip On Board)超微小间距LED技术的引入,LED智能会议一体机正迎来前所未有的发展机遇,成为大势所趋。 COB技术通过将LED芯片直接封装在基