无人驾驶百科丨“AI驾驶员”成为“老司机”的五项必备技能

2023-10-14 22:20

本文主要是介绍无人驾驶百科丨“AI驾驶员”成为“老司机”的五项必备技能,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

b463c9cfcf22cced045979aa0d989067.gif

“AI驾驶员”作为未来交通出行与物流运输的关键角色,实现从“新司机”到“老司机”的蜕变需要满足哪些条件?如何在保证安全的前提下显著提升工作效率?

在第三期博闻驭势 U-Logue上,驭势科技规划控制算法研发总监周小成先生,带您剖析“AI驾驶员”成为“老司机”必备的五项技能。

全程视频回看请点击“阅读原文”,以下为课程摘要:

“AI驾驶员”也与我们人学车一样,从简单路况开始学习,慢慢熟悉车辆的性能、操作与交通规则等,之后演进到能够在公开道路上行驶,有着从“新司机”到“老司机”的演变过程。

第一部分

什么样的AI驾驶员才是“老司机”?

一千个人眼中有一千个哈姆雷特,有人说,老司机需要熟悉车辆性能、车感好;有的人说,老司机能把车开的又快又稳又省油;也有人说,老司机该快的时候会快,该慢的时候时候会慢;老司机除了看前方,还会经常看左右后视镜,把握周边其他车辆的状况…等等。

首先,从驾驶效果来说,老司机能完美兼顾安全、平顺、高效

  • 安全:坐老司机的车,你会特别放心,不会担心发生交通事故,也不会担心他会开赌气车,造成不必要的麻烦。

  • 平顺:即使你容易晕车,坐老司机的车,也不会有不适感,整个行程你几乎感受不到急刹急停。

  • 高效:体现在两个方面,一个方面是时间的高效,老司机大部分情况能做到准时通勤;另一方面是能耗的高效,相比于新司机,同样的一百公里,老司机的油耗要低很多。

其次,老司机得有很好的驾驶技能,支撑他把车开得安全、平顺和高效。这些驾驶技能包括:眼观四路、熟悉路况、提前预判、防御驾驶、人车合一

fc1a02e718ef273002682dc39dbcd98e.png

第一项技能

眼观四路

新司机开车的时候,视野会非常窄,通常只会关注前方车辆的状况,最多能再关注到自己特别感兴趣的一些事物。而老司机开车的时候视野会全方位打开,会同时关注视野范围内可能对本车行驶产生影响的潜在风险;此外,老司机还会特别关注后视镜,观察后方是不是存在需要关注的潜在风险。

由于配置了360度全方位覆盖的传感器,眼观四路是“AI驾驶员”的天然优势,把车辆前后左右的交通情况尽收眼底,虽然现阶段在感知的距离和准确度等方面还存在着不足之处,但是随着传感器、算力平台、算法的不断升级,并且在不断收集的海量数据驱动下,“AI驾驶员”会“看”得越来越远、越来越精准。

979447870a5c4af28d0b4075cb3c291f.png

第二项技能

熟识路况

经常开车的司机对“熟识路况”的重要性应该都深有体会。即使现在实时导航功能已经非常强大,在一个陌生的地方开车和在每天上下班的路上开车的体验是完全不一样的。由于有高清地图,对于“AI驾驶员”来说能开车的地方都是“熟悉”的地方。

高清地图不仅能存储车道线、路口、红绿灯、人行道等基本交通元素,还可以存储施工区域、交通流量等动态交通信息。通过地图采集和生成工具,这些交通元素和信息可以自动化生成和更新,并被“AI驾驶员”使用。

cfb34070a787b73e143ad2cea59f1a27.png

第三项技能

提前预判

提前预判其他车辆和行人的意图并采取相应措施,是“老司机”的另一个很重要的驾驶技能,对“AI驾驶员”而言,这一驾驶技能尤其重要。

“AI驾驶员”首先需要预判其他车辆的行驶轨迹,即预判其他车辆是沿车道直行、往左换道超越前方慢速行驶的车辆、还是稍微偏一点避开前方压线行驶的大车;其次,需要预判其他车辆的加减速意图,即预判其他车辆是继续按当前速度行驶、还是加速往前开、或者马上刹车;最后,在路口和其它车辆会车的时候,还需要预判抢让意图,即预判其他车辆是会抢先通过路口,还是会礼让,让本车先通行。

对于“AI驾驶员”而言,提前预判的难点在于对场景语义和障碍物之间交互的理解。以下为一些例子:

  • 由于红绿灯即将从红灯变成绿灯,有行人会在抢黄灯通过路口,需要预判行人抢行;

  • 非机动车从道路的另一侧移动过来,此时本车前进方向的车流速度已经非常快,因此需要预判非机动车会停在路口中间等待。

  • 本应该停在路口等待的一群非机动车,直接在本车前方闯红灯抢行通过,这些违反交通规则的驾驶行为,进一步增加了预判的难度。

  • 本车左边车道前方有一个慢速行驶的车辆,因此需要预判左后方的车辆会换道到本车道。

  • 由于本车道前方有慢速车流,右边的车辆切入后,需要预判其切入后快速刹车。

  • 由于右转车辆快速汇入,需要预判右边车道的车辆会切入到本车道,需要躲避右边汇入的车辆。

以一个旁车切入后快速刹车的场景来说明预判对驾驶安全、平顺的影响:在这种情景下,没有预判的司机只有看见切入的车辆刹车后才反应,需要急刹车才能保证不追尾,此时车上的乘客会有非常强烈的不适感。而当考虑到前方红灯和等待的车流,驾驶员可以提前预判旁边的车辆切入状况,此时本车可以提前缓刹,既能保证和前车有足够的安全距离,也能保证行驶的平顺性。

第四项技能

防御驾驶

百度百科是这么定义防御驾驶的:防御性驾驶技术是将相关的驾驶技能和驾驶习惯进行系统的总结和归纳,形成一套简单明了、科学系统的安全驾驶体系,它能帮助驾驶员更清楚地了解人类的“生理缺陷”、更全面地观察并了解驾驶环境、更准确地预测不确定的潜在的危险因素、更及时地采取预防措施避免交通事故。

在这个定义中,很重要的一个关键词是“不确定”。对“AI驾驶员”而言,主要有3类不确定:意图不确定、运动不确定和盲区不确定。以下图中路口场景中的左边车辆为例,意图不确定是指其有可能右转、有可能直行、也有可能左转;运动不确定是指在其意图明确的情况下,具体的行驶轨迹是不确定的;盲区不确定是指感知盲区中的路况是不确定的。对人类驾驶员而言,盲区不确定是比较难处理的,相应的“鬼探头”也是交通事故频发的场景。

e8eb765d53e2d98c0b038842dc943de2.png

如何处理意图不确定?首先,“AI驾驶员”根据车辆的状态和其所在的环境,会给出所有可能意图的概率;其次,针对不同意图的概率,“AI驾驶员”会进行所有的可能性推演,综合考虑安全、平顺、效率的因素,最终选择一个最优的决策。

如何处理盲区不确定?首先需要根据传感器的位置和周边的环境,确定哪些区域是感知盲区,然后根据道路和周边障碍物等因素确定“鬼探头”的可能性,在存在“鬼探头”可能性的时候,适当降速,谨慎通过。

第五项技能

人车合一

说到“人车合一”,刚拿到驾照的朋友首先会想到泊车场景,尤其是侧方位泊车。在泊车场景中,即使在泊车位左右两边只留出5cm空间的非常极限的情况下,“AI驾驶员”也能非常精准、顺畅地将车驶入泊车位。

5b642e62b7a811f750fb545b1dc947b1.png

在开放道路上,“AI驾驶员”更像是在用上帝视角开车,因为准确知道本车位置、尺寸及周边障碍物情况,只要保证车辆在可通行区域内行驶,即可保证本车不和其他车辆发生剐蹭。

“人车合一”的另一个难点是操纵不同类型的车辆。香港国际机场使用的驭势科技的无人车中有无人驾驶巡逻车、用于运输货物的无人驾驶物流车、用于乘客摆渡的无人驾驶中巴。此外,在驭势科技的车辆大家庭中,还有用于厂内物流的小型拖车、城市服务的Uibox等多种车型。对“AI驾驶员”而言,操作这些不同类型的车辆都不在话下,能够成长为熟练操作“A牌+B牌+C牌+城市服务”的“老司机”。因为这些车辆虽然尺寸不同,但背后的动力学、运动学模型都是一致的,而建模和计算是“AI驾驶员”最擅长的事情。

20b37e3dd90a1bf71565181585a59019.png

以转向为例:在无人驾驶运动控制中,车辆的运动模型都可以简化为阿克曼转向模型(一种为了解决交通工具转弯时,内外转向轮路径指向的圆心不同的几何学)。经简化后,各种车型在运动控制中的区别主要体现在车辆轴距和转向系统延时等参数上。因此,只要针对不同的车型设置不同的参数,即可实现“AI驾驶员”在不同车型上的适配。

在物流行业的应用中,车辆经常需要拉多个拖斗运输货物,这对驾驶员来说是一个很大的挑战。在香港国际机场,开拖车的司机需要专门招聘,并且培训很长一段时间通过考核后才能正式上岗。而“AI驾驶员”,能精确预测多个拖斗未来的占据位置,在保证安全的基础上,带着多个拖斗通过狭窄区域,准确停靠。

(视频来源于真实项目案例)

更进一步,很多物流应用中,需要带着拖斗实现倒车、精准对接、拖斗自动脱挂钩等操作,很多老司机都很难成功进行这些操作,而“AI驾驶员”都可以顺利完成,极大降低了人力成本,为机场降本增效

第二部分

如何保证“AI老司机”演进过程不回退

人在学会一项技能之后,这个技能即成为人的一个本能,除非人的身体机能出现问题,否则这个学会的技能不容易退化。那对于“AI驾驶员”而言,如何保证在往老司机的演进过程中能达到同样的效果?

基于这方面考量,驭势科技提出并实现了一个基于场景库的算法演进平台。场景库是这个算法演进平台的核心,在实车测试中遇见的关键场景,会不停积累到这个场景库中。当算法升级时,根据算法升级的情况,我们将从场景库中抽取关键测试场景,并通过泛化生成大量测试场景集。只有当算法在仿真环境中通过这些测试场景集的测试,才能确定算法迭代升级成功。

9fe2ae736d8667c01da155be2375e5fe.png

目前,场景集中已经积累了大量的场景。在下图中例举了6个换道相关的典型场景。因为有了一个完整的换道场景集,在升级换道相关算法的时候,能够保证算法一直往前演进,而不出现性能退化。

c1b035ab1f1ca194a40a7a4251089406.png

再举一个基于场景做算法优化的例子:像之前谈到的盲区不确定性,我们制作了场景案例,研发人员可以基于这个场景,不停优化相关处理算法,并在仿真中测试优化效果,直至达到一个期望的优化效果。

f5db23c8cd0742223d7c024860b75509.png

最后回顾一下本期内容:为了达到老司机兼顾安全、平顺、高效的行驶效果,“AI驾驶员”需要做到眼观四路、熟识路况、提前预判、防御驾驶、人车合一。目前,“AI驾驶员 ”有还需要进一步提升的地方。“AI驾驶员”的提升,通过两个方向来进行。一方面,通过算力、传感器和算法的不断提升,通过不断收集的海量数据驱动,不断演进“AI驾驶员”的驾驶技能;另一方面,我们通过基于场景库的算法演进平台,保证“AI驾驶员”在演进过程中不出现驾驶技能的回退。在这两个“车轮”的推动下,“AI驾驶员”的驾驶技能会不断往前演进,最终成为一个真正的“老司机”,实现完全的无人驾驶。

6ed8d42416306bf509fa59884bbb7f17.png

用进废退,进化论也同样适用于“AI驾驶员”,在真实世界不断探索与实践,持续地学习海量数据,为实现在纷杂的世界中做出最正确的决策不停努力,驭势科技一直在努力前行。

拥有十八般武艺的“AI老司机”在实际运行中会是什么样的状态?什么样的场景能够率先享受到安全、平顺、高效的服务呢?欢迎持续关注博闻驭识 U-Logue,和你一起探索自动驾驶的前沿应用,感受站在技术浪潮前沿的成就感。

c0fe4112790fd404eb3b96fb3b7e71d6.png

151f9bebbb12d21b5d58f77248544184.png

92a5b36494c261f199768b5e97e4f57b.png

b84582666ecf48fb2ba3096baf7d9600.png

432e600fc3afba3a2759fe3bc2ec45e6.gif

这篇关于无人驾驶百科丨“AI驾驶员”成为“老司机”的五项必备技能的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/213528

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题

题库来源:安全生产模拟考试一点通公众号小程序 2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题是由安全生产模拟考试一点通提供,流动式起重机司机证模拟考试题库是根据流动式起重机司机最新版教材,流动式起重机司机大纲整理而成(含2024年流动式起重机司机证模拟考试题库及流动式起重机司机理论考试试题参考答案和部分工种参考解析),掌握本资料和学校方法,考试容易。流动式起重机司机考试技

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU