全局思考,无人驾驶冠军亲述算法经验 | AI challenger 2018

本文主要是介绍全局思考,无人驾驶冠军亲述算法经验 | AI challenger 2018,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

640?wx_fmt=png


作者 | Just

出品 | AI科技大本营


视觉是无人驾驶汽车的勘探物理世界的非常重要的“器官”。在它背后,考验的则是机器算法能力。


无人驾驶技术的算法包括感知、定位、预测、决策、控制等层面,而在由创新工场、搜狗、美团点评、美图公司联合主办的 AI Challenger 2018 全球 AI 挑战赛中,无人驾驶赛道的题目就是最基础的视觉感知,所有参赛队伍需要解决如何通过视觉传感器看到的数据,来感知判断出障碍物、路标、汽车限速以及红绿灯等维度的问题。


近日的总决赛颁奖礼上,美团点评首席科学家夏华夏称,由于视觉感知有上述诸多不同的识别维度,那在工程层面不可能对每项任务都做一个模型出来,最好的方案是由一个模型可以同时用视觉信号找到多种识别目标,但这并不容易。


根据大赛规定,此次自动驾驶赛道的评判标准分为两部分,一是准确度,二是速度,后者在实验室研究中很容易忽略,更具体来说,在测试和实际运行时,很少有参赛队伍在比赛前考虑能否实现实时性检测的问题。体现在算法上,关键的是要平衡算法执行效率和性能。


在历时 3 个多月,经过数轮比赛角逐后,来自中科院自动化所 SeeLess 团队最终斩获了这一赛道的冠军。那么,他们是如何让算法发挥了最佳效果?


640?wx_fmt=png


首先在数据上,主办方给无人驾驶的赛道数据量约 1.2 亿张,其中 10 万张属于标注数据。冠军成员中的博士研究生赵旭在接受 AI科技大本营采访时称,标注数据中大约有 7 万张是优质数据,他们验证了 1 万张图片数据,2 万张在测试时使用,剩下的则是未标注数据,他们用了自动化方法来处理这些数据。赵旭认为,庞大的数据量对训练算法性能非常重要。


而在算法层面,执行效率分为两部分:算法实现复杂度和工程实现的优化。基于此,他们同时做了几个方案,另一冠军成员朱优松在颁奖礼上举例称,就车道线行驶区域的判别以及道路上的物体检测两大任务,他们使用了同一模型来实现,以降低算法实现的复杂度,同时他们把神经网络进行压缩,并使用了“老师教学生(大模型教小模型)”的方法。


而工程实现上他们注重细节,不断调整优化,比如就可行驶道路区域分割问题,仅使用底层的计算机视觉特征并不足够,他们还因此引入了一些全局特征,此外还将 GPU 并行做到极致,如此才达到了很好的效果。


“全局思考”是赵旭对这次比赛的经验性总结,当然,基础研究更要考虑工程实践具体情况的观点也尤为重要。


创新工场人工智能工程院执行院长王咏刚评价 SeeLess 团队的成绩时表示,他们在保持识别精度的同时识别性能也远超其他团队,在算法和工程的结合度上远超预计,这代表未来不同的硬件平台都可以利用先进的无人驾驶技术。


不过,视觉感知只是做无人驾驶的一个切面,要做好它需要考虑对技术栈的综合应用,这包括很多软硬件的能力。美团点评首席科学家、无人配送部总经理夏华夏认为,全场景下的无人驾驶技术应用还有很远的距离,感知、定位、预测、规划、控制每一方面都极具挑战,如果要预估什么时候人们能普遍做上无人驾驶汽车,“十年之后”是他给出的一个非常乐观的期限。


(*本文由AI科技大本营整理,转载请联系微信1092722531)

公开课预告

推荐系统


在当今人工智能浪潮之下,个性化推荐技术更是风靡业界,在金融、传媒、短视频、电商、教育等诸多领域大放异彩,影响人们生活的方方面面。不仅方便了人们获取各种各样的信息,还给企业带来了收益的大幅提升。本次分享带你揭开个性化推荐的神秘面纱,从推荐算法到大型系统架构进行全面剖析。


640?wx_fmt=jpeg


推荐阅读

  • 精选180+Python开源项目,随你选!做项目何愁没代码

  • 中国程序员开发的神奇网站:变量命名神奇!

  • 从比特币披萨到区块链卫星,程序员真会玩儿!

  • 更新微信 7.0,你后悔了吗?

  • 用好这8个途径,可以解决程序员90%的问题!

  • 漫画:为什么互联网人收入高,却这么低调

  • 刘强东无罪!

点击“阅读原文”,打开APP 阅读更顺畅。

这篇关于全局思考,无人驾驶冠军亲述算法经验 | AI challenger 2018的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/297632

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig