本文主要是介绍Fast and accurate object detection in high resolution 4K and 8K video using GPUs 论文笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
文章目录
- 一、基本信息
- 二、研究背景
- 三、创新点
- 3.1 概述
- 3.2 详解
- 3.2.1 问题分析
- 3.2.2 Attention pipeline
- 3.2.3 Implementation of the client-server version
- 四、实验结果
- 五、结论与思考
- 5.1 作者结论
- 5.2 记录该工作的亮点,以及可以改进的地方
- 参考
一、基本信息
标题:《Fast and accurate object detection in high resolution 4K and 8K video using GPUs》
时间:2018-10-26
出版源:HPEC 2018
论文领域:目标检测(Object Detection)
主要链接:
- homepage:None
- arXiv(Paper):https://arxiv.org/abs/1810.10551
- github:https://github.com/previtus/AttentionPipeline
关键词:yolov2、attention、high resolution
二、研究背景
大多数目标检测论文都是聚焦在低分辨率图像上(特别是VOC、COCO),而低分辨率图像会损失很多细节,并且目前很多设备拍摄的图像或者视频都是高清的(4k/8k)。
如下图所示,一幅高清图像可以识别到更多的目标,如果使用传统的目标检测算法,resize图像后,会丢失很多目标(recall很低)。
因此这篇论文主要针对高清图像/视频来提出有效的目标检测算法,保证准确率和速度。
三、创新点
3.1 概述
论文提出Attention pipeline。第一阶段,将原始图像下采样(downscaling)到低分辨率空间中。在低分辨率中目标检测引导model attention到原图的重要区域。第二阶段,model直接处理原图上的区域,仅限于上述highlighted areas。
这里有个关键词Attention
这篇关于Fast and accurate object detection in high resolution 4K and 8K video using GPUs 论文笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!