高分辨率目标检测——(转载)在4K/8K视频中进行物体检测

2024-06-13 10:38

本文主要是介绍高分辨率目标检测——(转载)在4K/8K视频中进行物体检测,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

参考 https://baijiahao.baidu.com/s?id=1616657317266058736&wfr=spider&for=pc

研究人员利用GPU在4K/8K视频中进行物体检测

卡内基梅隆大学的研究人员开发出一种新系统,该系统使用GPU快速准确地检测4K和8K视频中的物体。研究人员表示,虽然大量数据源以高分辨率记录,但目前最先进的物体检测模型,如YOLO,Faster RCNN,SSD等,只能处理具有相对较低分辨率的视频,约为608 x 608像素。

目前大多数模型使用这些图像有三个原因:它们足以完成任务;处理低分辨率图像更具时间效率;许多用于训练模型的公开数据集由低分辨率图像组成。当然,低分辨率的问题在于视频没有获得很多细节。随着4K甚至8K相机的数量不断增加,需要一种新的模型来分析它们。

卡内基梅隆大学的研究人员开发出的这种新系统,将物体检测的任务分为两个阶段,两个阶段都涉及通过将原始图像与规则网格重叠来细分原始图像,然后将模型YOLO v2应用于快速对象检测。开发者创造了许多小型矩形作物,可以通过YOLO v2在几个服务器工作者上以并行方式处理。第一阶段将图像缩小为较低分辨率并执行快速物体检测以获得粗糙的边界框。第二阶段使用这些边界框作为注意图来决定在高分辨率下检查图像的位置。因此当图像的某些区域不包含任何感兴趣的对象时,开发者可以节省处理它们的资源。

研究人员在代码中实现了他们的模型,该代码将工作分布在GPU上,在设法保持高精度的同时,在4K视频和8K视频上分别达到3-6fps和2fps的性能,与将图像缩小到低分辨率的YOLO v2方法相比,该方法将平均精度得分从33.6 AP50提高到74.3 AP50。与在高分辨率下处理原始图像的每个部分相比,这种方法将处理高分辨率图像所需的时间缩短了大约20%。 这实际意味着近乎实时的4K视频处理是可行的。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这篇关于高分辨率目标检测——(转载)在4K/8K视频中进行物体检测的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1057073

相关文章

Python调用Orator ORM进行数据库操作

《Python调用OratorORM进行数据库操作》OratorORM是一个功能丰富且灵活的PythonORM库,旨在简化数据库操作,它支持多种数据库并提供了简洁且直观的API,下面我们就... 目录Orator ORM 主要特点安装使用示例总结Orator ORM 是一个功能丰富且灵活的 python O

Nginx设置连接超时并进行测试的方法步骤

《Nginx设置连接超时并进行测试的方法步骤》在高并发场景下,如果客户端与服务器的连接长时间未响应,会占用大量的系统资源,影响其他正常请求的处理效率,为了解决这个问题,可以通过设置Nginx的连接... 目录设置连接超时目的操作步骤测试连接超时测试方法:总结:设置连接超时目的设置客户端与服务器之间的连接

Python如何实现PDF隐私信息检测

《Python如何实现PDF隐私信息检测》随着越来越多的个人信息以电子形式存储和传输,确保这些信息的安全至关重要,本文将介绍如何使用Python检测PDF文件中的隐私信息,需要的可以参考下... 目录项目背景技术栈代码解析功能说明运行结php果在当今,数据隐私保护变得尤为重要。随着越来越多的个人信息以电子形

使用 sql-research-assistant进行 SQL 数据库研究的实战指南(代码实现演示)

《使用sql-research-assistant进行SQL数据库研究的实战指南(代码实现演示)》本文介绍了sql-research-assistant工具,该工具基于LangChain框架,集... 目录技术背景介绍核心原理解析代码实现演示安装和配置项目集成LangSmith 配置(可选)启动服务应用场景

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》:本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为

SpringBoot中使用 ThreadLocal 进行多线程上下文管理及注意事项小结

《SpringBoot中使用ThreadLocal进行多线程上下文管理及注意事项小结》本文详细介绍了ThreadLocal的原理、使用场景和示例代码,并在SpringBoot中使用ThreadLo... 目录前言技术积累1.什么是 ThreadLocal2. ThreadLocal 的原理2.1 线程隔离2

Python利用PIL进行图片压缩

《Python利用PIL进行图片压缩》有时在发送一些文件如PPT、Word时,由于文件中的图片太大,导致文件也太大,无法发送,所以本文为大家介绍了Python中图片压缩的方法,需要的可以参考下... 有时在发送一些文件如PPT、Word时,由于文件中的图片太大,导致文件也太大,无法发送,所有可以对文件中的图

Java如何获取视频文件的视频时长

《Java如何获取视频文件的视频时长》文章介绍了如何使用Java获取视频文件的视频时长,包括导入maven依赖和代码案例,同时,也讨论了在运行过程中遇到的SLF4J加载问题,并给出了解决方案... 目录Java获取视频文件的视频时长1、导入maven依赖2、代码案例3、SLF4J: Failed to lo

如何使用Spring boot的@Transactional进行事务管理

《如何使用Springboot的@Transactional进行事务管理》这篇文章介绍了SpringBoot中使用@Transactional注解进行声明式事务管理的详细信息,包括基本用法、核心配置... 目录一、前置条件二、基本用法1. 在方法上添加注解2. 在类上添加注解三、核心配置参数1. 传播行为(

Java实战之自助进行多张图片合成拼接

《Java实战之自助进行多张图片合成拼接》在当今数字化时代,图像处理技术在各个领域都发挥着至关重要的作用,本文为大家详细介绍了如何使用Java实现多张图片合成拼接,需要的可以了解下... 目录前言一、图片合成需求描述二、图片合成设计与实现1、编程语言2、基础数据准备3、图片合成流程4、图片合成实现三、总结前