旷视科技获AI顶赛Wider Challenge人脸检测冠军

2023-10-18 23:10

本文主要是介绍旷视科技获AI顶赛Wider Challenge人脸检测冠军,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 

Wider Face and Pedestrian Challenge 2018(简称 Wider Challenge)是一项全球范围内的计算机视觉顶级赛事,旷视科技(Megvii)参战了其中人脸检测比赛 Wider Face,最终以 0.5582 的成绩技压群雄,勇夺人脸检测冠军。旷视科技人脸检测冠军纪录最早可追溯至 2013 年赢得人脸识别领域 3 项世界冠军。下面,本文将从比赛、技术、团队以及产业 4 个维度展开解读。

Wider Face 比赛结果。

 

关于 Wider Challenge

Wider Challenge 2018 是由计算机视觉顶会 ECCV 2018 举办的顶级挑战赛之一,吸引全球超过 400 多支队伍参加,比赛及结果公布于 ECCV 会前完成,颁奖仪式及相关研讨会安排在大会期间(9 月 8 号)。继 FDDB 之后,Wider Challenge 成为计算机视觉检测领域的基准比赛,含金量很高,在一定程度上可以清晰反映参赛方技术力量的实况和积淀。

今年,该比赛旨在解决人体检测领域的 3 个核心问题:人脸的精确定位,人体的精确定位,以及人物身份精确匹配。为此,Wider Challenge 2018 相应地分为 3 个比赛(track):

  • WIDER Face, 目标是深掘新方法,刷新人脸检测当前最佳水平。
  • WIDER Pedestrian, 目标是收集有效而高效的新方法,优化解决自然场景之下的行人检测问题。
  • WIDER Person Search, 从 192 部电影中进行目标精确匹配的人物搜索。

自左向右,三个比赛的实例。

 

关于技术

从技术角度讲,这次的人脸检测比赛 Wider Face 出现了新难点,为此旷视科技给出了一套自己的解决方案,取得第一名的成绩,超越第二名微软(MSRA)2 个点。

难点

相比以往,WIDER Face 2018 有 2 个显著的难点。一是数据集,二是评估标准。

Wider Face 比赛使用同名数据集,它首次开源于 CVPR 2016,包含 32,203 张图像和 393,703 个检测框标注,是当前不同场景之下人脸类别跨度最大的数据集,从小脸密集脸、多姿态脸、遮挡脸、表情脸、化妆脸到模糊脸,一应俱全。

Wider Face 数据集中不同类别的人脸。

 

前人脸检测基准 FDDB 由于数据量小且简单退出之后,Wider Face 晋级为人脸检测领域最科学、最权威的基准数据集,同时今年还进行了一些优化标注甚至是重新标注,堪称是人脸检测能力比拼的最佳平台。显而易见,比赛难度也加大很多。

Wider Face 2018 评估标准沿用 COCO 规范,更细致更严格,对定位要求更高,不仅要大概准,还要非常准,甚至是“变态准”。具体来讲,它不再只使用 AP_50,而是计算检测框 IoU 阈值超过 10 的平均精度,从 AP_50 到 AP_95(步长为 5,共 10 个 AP)进行加权求平均值。这再次加大了比赛夺冠的难度。

方法

鉴于上述两个新挑战,旷视科技在技术沉淀的基础上,从算法模型、Backbone 以及数据增强 3 个方面给出了原创性的解决方案。

旷视科技作为 COCO 冠军,在物体检测方面“家底”极厚,身经百战,形成了一套优秀的“演练作战传统”。此次针对 Wider Face 人脸检测的小脸、模糊脸问题,旷视科技提出一种基于单阶段检测器的新方法,称之为级联检测网络(Cascade Detection Network)。

在 Backbone 以及数据增强方面,旷视同样做了新探索。比如 Backbone 避重就轻,没有选择 ResNet 101,而是采样了像 DenseNet 121、 ResNet 50 这样相对轻量化的基础网络,或者多个轻模型的融合。旷视科技后续会针对性地出一篇论文,想了解更多的人请留意关注。

结果

通过上述原创技术,旷视科技比赛结果优势明显,不仅夺得第一名,成绩还大幅超过第二名、第三名,分别高出 2 个点和 5 个点。另外,旷视科技单模型和多模型结果都提交过,结果表明,即使是按照单模型,同样可以拿到冠军。

值得一提的是,旷视科技上层技术的创新源自底层技术和原创深度学习平台的支撑。这次打赛过程中,旷视科技自研的深度学习云平台 Brain++ 有力保障了模型训练的稳定性;原创的深度学习引擎(先于 TensorFlow)则保证高效快速地训练和测试模型,避免时耗。正是因为有后方的保障,才有前方的胜利。

关于团队

打比赛就像打仗一样,是一支队伍,需要团队协作。但是旷视这次的比赛,也仅仅动用了 1.5 名实习小矿工:一个为主,一个为辅(外加检测组负责人和研究员的指导)。这种实习生冲在一线的打赛模式是一种锻炼和培养新人成长的宝贵机会。第一名的成绩也反证了这种模式的科学性。

1.5 名实习生,这并不是说旷厂缺人,也不是轻视打赛,这恰恰说明了旷厂有一套完备的“演练打赛机制”,不仅节约了大量人力和时间成本,而且纳入这套机制的每一方皆有所获。本质上这是一种高效的经验传承,实习生获得大量输入,再经由天赋的脑瓜,输出第一名的成绩,由此借假(比赛)修真(能力提升),人与事两相成。

关于产业

人脸检测在旷视的整个计算机视觉技术矩阵中处于中层,属于核心算法之一,经过工程化包装或者硬件的加持,形成高效可复制的模型框架,从而最终走向人脸相关的产品线。

人脸检测是机器视觉技术落地的最大场景之一,是旷视图像识别技术的四大对象之一(人、脸、车、字),也是旷视 AI+IoT 战略中承上启下的一环。这一冠军成绩所反映出的技术点创新将进一步优化旷视的整个技术体系,导向手机、安防、地产、零售等多个产业领域,为达成 AI+IoT 战略提供了有力的技术支撑。

这篇关于旷视科技获AI顶赛Wider Challenge人脸检测冠军的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/235690

相关文章

Spring AI集成DeepSeek三步搞定Java智能应用的详细过程

《SpringAI集成DeepSeek三步搞定Java智能应用的详细过程》本文介绍了如何使用SpringAI集成DeepSeek,一个国内顶尖的多模态大模型,SpringAI提供了一套统一的接口,简... 目录DeepSeek 介绍Spring AI 是什么?Spring AI 的主要功能包括1、环境准备2

Spring AI集成DeepSeek实现流式输出的操作方法

《SpringAI集成DeepSeek实现流式输出的操作方法》本文介绍了如何在SpringBoot中使用Sse(Server-SentEvents)技术实现流式输出,后端使用SpringMVC中的S... 目录一、后端代码二、前端代码三、运行项目小天有话说题外话参考资料前面一篇文章我们实现了《Spring

Spring AI与DeepSeek实战一之快速打造智能对话应用

《SpringAI与DeepSeek实战一之快速打造智能对话应用》本文详细介绍了如何通过SpringAI框架集成DeepSeek大模型,实现普通对话和流式对话功能,步骤包括申请API-KEY、项目搭... 目录一、概述二、申请DeepSeek的API-KEY三、项目搭建3.1. 开发环境要求3.2. mav

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

Spring AI集成DeepSeek的详细步骤

《SpringAI集成DeepSeek的详细步骤》DeepSeek作为一款卓越的国产AI模型,越来越多的公司考虑在自己的应用中集成,对于Java应用来说,我们可以借助SpringAI集成DeepSe... 目录DeepSeek 介绍Spring AI 是什么?1、环境准备2、构建项目2.1、pom依赖2.2

Python如何实现PDF隐私信息检测

《Python如何实现PDF隐私信息检测》随着越来越多的个人信息以电子形式存储和传输,确保这些信息的安全至关重要,本文将介绍如何使用Python检测PDF文件中的隐私信息,需要的可以参考下... 目录项目背景技术栈代码解析功能说明运行结php果在当今,数据隐私保护变得尤为重要。随着越来越多的个人信息以电子形

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

SpringBoot整合DeepSeek实现AI对话功能

《SpringBoot整合DeepSeek实现AI对话功能》本文介绍了如何在SpringBoot项目中整合DeepSeekAPI和本地私有化部署DeepSeekR1模型,通过SpringAI框架简化了... 目录Spring AI版本依赖整合DeepSeek API key整合本地化部署的DeepSeek

PyCharm接入DeepSeek实现AI编程的操作流程

《PyCharm接入DeepSeek实现AI编程的操作流程》DeepSeek是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的AI模型,接下来,我们把DeepSeek接入到PyCharm中... 目录引言效果演示创建API key在PyCharm中下载Continue插件配置Continue引言