【开盖即食】多种算法实现画面动静判断(附源码)

2024-08-22 03:12

本文主要是介绍【开盖即食】多种算法实现画面动静判断(附源码),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

大家好,我是cv君,今天想跟大家分享一下,如何实现画面动静判断、判断画面或者物体是否在运动或者是比较静止,简单使用计算机视觉传统方法实现,AI的后续带给大家。我们提供三种方案:

1、背景消除法;

2、光流追踪法;

3、相似度、清晰度变化法;

代码开盖即食,拿来可用,请品尝~

然后我们可以把视频中运动的部分保留,静止的部分扣除;

1、背景消除法;

import cv2
import numpy as np# 配置视频文件路径和输出文件路径
video_path = r"demo3.mp4"
output_video_path = r"demo3.avi"# 打开视频文件
cap = cv2.VideoCapture(video_path)
if not cap.isOpened():print("无法打开视频文件")exit()# 获取视频基本信息
fps = cap.get(cv2.CAP_PROP_FPS)  # 帧率
frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))# 创建背景减除器
bg_subtractor = cv2.createBackgroundSubtractorMOG2(varThreshold=30)
# fgbg = cv2.createBackgroundSubtractorMOG2(varThreshold=30, detectShadows=True)  # 设置输出视频编解码器
fourcc = cv2.VideoWriter_fourcc(*'MJPG')
out = cv2.VideoWriter(output_video_path, fourcc, fps, (frame_width, frame_height))# 处理每一秒的帧
frame_count = 0
seconds_counter = 0
frame_buffer = []while True:ret, frame = cap.read()if not ret:breakframe_count += 1second = int(frame_count // fps)  # 当前秒钟# 应用背景减除器fg_mask = bg_subtractor.apply(frame)# 计算前景区域的像素数量non_zero_count = cv2.countNonZero(fg_mask)# 保存当前帧到缓冲区frame_buffer.append(frame)# 每秒钟结束时判断运动情况if frame_count % 10 == 0:# print(non_zero_count)if non_zero_count > 15000:  # 根据实际情况调整阈值print(f"第 {second} 秒有运动")for f in frame_buffer:out.write(f)  # 将帧写入输出视频else:print(f"第 {second} 秒静止")frame_buffer.clear()  # 清空缓冲区准备处理下一秒的帧# 释放资源
cap.release()
out.release()
cv2.destroyAllWindows()

2、光流追踪法;

import cv2
import numpy as np# 配置视频文件路径和输出文件路径
video_path = r"zjkzlzxjg-1511.ts"
output_video_path = r"demo3.avi"# 打开视频文件
cap = cv2.VideoCapture(video_path)
if not cap.isOpened():print("无法打开视频文件")exit()# 获取视频基本信息
fps = cap.get(cv2.CAP_PROP_FPS)  # 帧率
frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))# 设置输出视频编解码器
fourcc = cv2.VideoWriter_fourcc(*'MJPG')
out = cv2.VideoWriter(output_video_path, fourcc, fps, (frame_width, frame_height))# 读取第一帧
ret, prev_frame = cap.read()
if not ret:print("无法读取视频帧")exit()prev_gray = cv2.cvtColor(prev_frame, cv2.COLOR_BGR2GRAY)# 提取关键点
prev_pts = cv2.goodFeaturesToTrack(prev_gray, maxCorners=1000, qualityLevel=0.3, minDistance=7, blockSize=7)if prev_pts is None:print("无法提取关键点")cap.release()out.release()cv2.destroyAllWindows()exit()
if prev_pts is not None:prev_pts = np.float32(prev_pts).reshape(-1, 1, 2)
# prev_pts = np.int0(prev_pts)frame_buffer = []
frame_count = 0while True:ret, frame = cap.read()if not ret:breakframe_count += 1second = int(frame_count // fps)  # 当前秒钟gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)# 计算光流next_pts, status, err = cv2.calcOpticalFlowPyrLK(prev_gray, gray, prev_pts, None)if next_pts is not None and status is not None:good_prev_pts = prev_pts[status == 1]good_next_pts = next_pts[status == 1]# 计算光流的总变化量displacement = np.linalg.norm(good_next_pts - good_prev_pts, axis=1)non_zero_count = np.sum(displacement > 0.0)  # 根据实际情况调整阈值# 保存当前帧到缓冲区frame_buffer.append(frame)# 每秒钟结束时判断运动情况if frame_count % 15 == 0:if non_zero_count > 0:  # 根据实际情况调整阈值print(f"第 {second} 秒有运动")for f in frame_buffer:out.write(f)  # 将帧写入输出视频else:print(f"第 {second} 秒静止")frame_buffer.clear()  # 清空缓冲区准备处理下一秒的帧prev_gray = grayprev_pts = good_next_pts.reshape(-1, 1, 2)else:print("光流计算失败")# 释放资源
cap.release()
out.release()
cv2.destroyAllWindows()

3、相似度、清晰度变化法;

import cv2
import numpy as np# 配置视频文件路径和输出文件路径
video_path = r"C:\Users\sunhongzhe\Pictures\expandai_move\a.mp4"
output_video_path = r"C:\Users\sunhongzhe\Pictures\expandai_move\a.avi"# 打开视频文件
cap = cv2.VideoCapture(video_path)
if not cap.isOpened():print("无法打开视频文件")exit()# 获取视频基本信息
fps = cap.get(cv2.CAP_PROP_FPS)  # 帧率
frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))# 设置输出视频编解码器
fourcc = cv2.VideoWriter_fourcc(*'MJPG')
out = cv2.VideoWriter(output_video_path, fourcc, fps, (frame_width, frame_height))# 读取第一帧
ret, prev_frame = cap.read()
if not ret:print("无法读取视频帧")exit()prev_gray = cv2.cvtColor(prev_frame, cv2.COLOR_BGR2GRAY)
prev_edges = cv2.Canny(prev_gray, 50, 150)frame_buffer = []
frame_count = 0# 运动检测阈值
motion_threshold = 3000  # 根据实际情况调整while True:ret, frame = cap.read()if not ret:breakframe_count += 1second = int(frame_count // fps)  # 当前秒钟gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)edges = cv2.Canny(gray, 50, 150)# 计算边缘图像的差异diff = cv2.absdiff(prev_edges, edges)non_zero_count = np.sum(diff > 0)# 保存当前帧到缓冲区frame_buffer.append(frame)# 每秒钟结束时判断运动情况if frame_count % 10 == 0:  # 每秒处理一次if non_zero_count > motion_threshold:  # 根据差异判断是否运动print(non_zero_count)print(f"第 {second} 秒有运动")for f in frame_buffer:out.write(f)  # 将帧写入输出视频else:print(f"第 {second} 秒静止")frame_buffer.clear()  # 清空缓冲区准备处理下一秒的帧prev_edges = edges# 释放资源
cap.release()
out.release()
cv2.destroyAllWindows()

开盖即食,大家随便放个运动、静止结合的视频进来,调整一下阈值即可实现动静分离;保留运动的视频,剔除静止的画面

第三个方法,剩下的大家可以用phash等相似度方法同理替换,请查阅我的另一篇文章:
【含泪提速!】一文全解相似度算法、跟踪算法在各个AI场景的应用(附代码)_image.antialias-CSDN博客

三个py的就按测阈值,大家都可以改哦,还有多久判断一次,都可以;

这是实现视频中动静画面区分的;

想要实现一个视频中,哪些画面在东,哪些画面在静止,就可以将画面分成多个区域,分别运算这些个算法,都可以得到哪些地方在动,哪些地方在静止了。

演示效果:原本视频没法上传,原视频15秒,静止部分有5秒,最后处理完后,成功剔除了静止部分的帧,保留下了运动的10秒

最后

最近cv君重新常更,欢迎三连~欢迎大家进入cv君的AI 与计算机视觉世界:DeepAI 视界 里面有几千位AI的朋友,有任何问题都可以交流哦,联系微信zxx15277368495z

这篇关于【开盖即食】多种算法实现画面动静判断(附源码)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1095079

相关文章

如何使用Java实现请求deepseek

《如何使用Java实现请求deepseek》这篇文章主要为大家详细介绍了如何使用Java实现请求deepseek功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1.deepseek的api创建2.Java实现请求deepseek2.1 pom文件2.2 json转化文件2.2

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

如何通过Python实现一个消息队列

《如何通过Python实现一个消息队列》这篇文章主要为大家详细介绍了如何通过Python实现一个简单的消息队列,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录如何通过 python 实现消息队列如何把 http 请求放在队列中执行1. 使用 queue.Queue 和 reque

Python如何实现PDF隐私信息检测

《Python如何实现PDF隐私信息检测》随着越来越多的个人信息以电子形式存储和传输,确保这些信息的安全至关重要,本文将介绍如何使用Python检测PDF文件中的隐私信息,需要的可以参考下... 目录项目背景技术栈代码解析功能说明运行结php果在当今,数据隐私保护变得尤为重要。随着越来越多的个人信息以电子形

使用 sql-research-assistant进行 SQL 数据库研究的实战指南(代码实现演示)

《使用sql-research-assistant进行SQL数据库研究的实战指南(代码实现演示)》本文介绍了sql-research-assistant工具,该工具基于LangChain框架,集... 目录技术背景介绍核心原理解析代码实现演示安装和配置项目集成LangSmith 配置(可选)启动服务应用场景

使用Python快速实现链接转word文档

《使用Python快速实现链接转word文档》这篇文章主要为大家详细介绍了如何使用Python快速实现链接转word文档功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 演示代码展示from newspaper import Articlefrom docx import

前端原生js实现拖拽排课效果实例

《前端原生js实现拖拽排课效果实例》:本文主要介绍如何实现一个简单的课程表拖拽功能,通过HTML、CSS和JavaScript的配合,我们实现了课程项的拖拽、放置和显示功能,文中通过实例代码介绍的... 目录1. 效果展示2. 效果分析2.1 关键点2.2 实现方法3. 代码实现3.1 html部分3.2

Java深度学习库DJL实现Python的NumPy方式

《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

最长公共子序列问题的深度分析与Java实现方式

《最长公共子序列问题的深度分析与Java实现方式》本文详细介绍了最长公共子序列(LCS)问题,包括其概念、暴力解法、动态规划解法,并提供了Java代码实现,暴力解法虽然简单,但在大数据处理中效率较低,... 目录最长公共子序列问题概述问题理解与示例分析暴力解法思路与示例代码动态规划解法DP 表的构建与意义动

java父子线程之间实现共享传递数据

《java父子线程之间实现共享传递数据》本文介绍了Java中父子线程间共享传递数据的几种方法,包括ThreadLocal变量、并发集合和内存队列或消息队列,并提醒注意并发安全问题... 目录通过 ThreadLocal 变量共享数据通过并发集合共享数据通过内存队列或消息队列共享数据注意并发安全问题总结在 J