【开盖即食】多种算法实现画面动静判断(附源码)

2024-08-22 03:12

本文主要是介绍【开盖即食】多种算法实现画面动静判断(附源码),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

大家好,我是cv君,今天想跟大家分享一下,如何实现画面动静判断、判断画面或者物体是否在运动或者是比较静止,简单使用计算机视觉传统方法实现,AI的后续带给大家。我们提供三种方案:

1、背景消除法;

2、光流追踪法;

3、相似度、清晰度变化法;

代码开盖即食,拿来可用,请品尝~

然后我们可以把视频中运动的部分保留,静止的部分扣除;

1、背景消除法;

import cv2
import numpy as np# 配置视频文件路径和输出文件路径
video_path = r"demo3.mp4"
output_video_path = r"demo3.avi"# 打开视频文件
cap = cv2.VideoCapture(video_path)
if not cap.isOpened():print("无法打开视频文件")exit()# 获取视频基本信息
fps = cap.get(cv2.CAP_PROP_FPS)  # 帧率
frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))# 创建背景减除器
bg_subtractor = cv2.createBackgroundSubtractorMOG2(varThreshold=30)
# fgbg = cv2.createBackgroundSubtractorMOG2(varThreshold=30, detectShadows=True)  # 设置输出视频编解码器
fourcc = cv2.VideoWriter_fourcc(*'MJPG')
out = cv2.VideoWriter(output_video_path, fourcc, fps, (frame_width, frame_height))# 处理每一秒的帧
frame_count = 0
seconds_counter = 0
frame_buffer = []while True:ret, frame = cap.read()if not ret:breakframe_count += 1second = int(frame_count // fps)  # 当前秒钟# 应用背景减除器fg_mask = bg_subtractor.apply(frame)# 计算前景区域的像素数量non_zero_count = cv2.countNonZero(fg_mask)# 保存当前帧到缓冲区frame_buffer.append(frame)# 每秒钟结束时判断运动情况if frame_count % 10 == 0:# print(non_zero_count)if non_zero_count > 15000:  # 根据实际情况调整阈值print(f"第 {second} 秒有运动")for f in frame_buffer:out.write(f)  # 将帧写入输出视频else:print(f"第 {second} 秒静止")frame_buffer.clear()  # 清空缓冲区准备处理下一秒的帧# 释放资源
cap.release()
out.release()
cv2.destroyAllWindows()

2、光流追踪法;

import cv2
import numpy as np# 配置视频文件路径和输出文件路径
video_path = r"zjkzlzxjg-1511.ts"
output_video_path = r"demo3.avi"# 打开视频文件
cap = cv2.VideoCapture(video_path)
if not cap.isOpened():print("无法打开视频文件")exit()# 获取视频基本信息
fps = cap.get(cv2.CAP_PROP_FPS)  # 帧率
frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))# 设置输出视频编解码器
fourcc = cv2.VideoWriter_fourcc(*'MJPG')
out = cv2.VideoWriter(output_video_path, fourcc, fps, (frame_width, frame_height))# 读取第一帧
ret, prev_frame = cap.read()
if not ret:print("无法读取视频帧")exit()prev_gray = cv2.cvtColor(prev_frame, cv2.COLOR_BGR2GRAY)# 提取关键点
prev_pts = cv2.goodFeaturesToTrack(prev_gray, maxCorners=1000, qualityLevel=0.3, minDistance=7, blockSize=7)if prev_pts is None:print("无法提取关键点")cap.release()out.release()cv2.destroyAllWindows()exit()
if prev_pts is not None:prev_pts = np.float32(prev_pts).reshape(-1, 1, 2)
# prev_pts = np.int0(prev_pts)frame_buffer = []
frame_count = 0while True:ret, frame = cap.read()if not ret:breakframe_count += 1second = int(frame_count // fps)  # 当前秒钟gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)# 计算光流next_pts, status, err = cv2.calcOpticalFlowPyrLK(prev_gray, gray, prev_pts, None)if next_pts is not None and status is not None:good_prev_pts = prev_pts[status == 1]good_next_pts = next_pts[status == 1]# 计算光流的总变化量displacement = np.linalg.norm(good_next_pts - good_prev_pts, axis=1)non_zero_count = np.sum(displacement > 0.0)  # 根据实际情况调整阈值# 保存当前帧到缓冲区frame_buffer.append(frame)# 每秒钟结束时判断运动情况if frame_count % 15 == 0:if non_zero_count > 0:  # 根据实际情况调整阈值print(f"第 {second} 秒有运动")for f in frame_buffer:out.write(f)  # 将帧写入输出视频else:print(f"第 {second} 秒静止")frame_buffer.clear()  # 清空缓冲区准备处理下一秒的帧prev_gray = grayprev_pts = good_next_pts.reshape(-1, 1, 2)else:print("光流计算失败")# 释放资源
cap.release()
out.release()
cv2.destroyAllWindows()

3、相似度、清晰度变化法;

import cv2
import numpy as np# 配置视频文件路径和输出文件路径
video_path = r"C:\Users\sunhongzhe\Pictures\expandai_move\a.mp4"
output_video_path = r"C:\Users\sunhongzhe\Pictures\expandai_move\a.avi"# 打开视频文件
cap = cv2.VideoCapture(video_path)
if not cap.isOpened():print("无法打开视频文件")exit()# 获取视频基本信息
fps = cap.get(cv2.CAP_PROP_FPS)  # 帧率
frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))# 设置输出视频编解码器
fourcc = cv2.VideoWriter_fourcc(*'MJPG')
out = cv2.VideoWriter(output_video_path, fourcc, fps, (frame_width, frame_height))# 读取第一帧
ret, prev_frame = cap.read()
if not ret:print("无法读取视频帧")exit()prev_gray = cv2.cvtColor(prev_frame, cv2.COLOR_BGR2GRAY)
prev_edges = cv2.Canny(prev_gray, 50, 150)frame_buffer = []
frame_count = 0# 运动检测阈值
motion_threshold = 3000  # 根据实际情况调整while True:ret, frame = cap.read()if not ret:breakframe_count += 1second = int(frame_count // fps)  # 当前秒钟gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)edges = cv2.Canny(gray, 50, 150)# 计算边缘图像的差异diff = cv2.absdiff(prev_edges, edges)non_zero_count = np.sum(diff > 0)# 保存当前帧到缓冲区frame_buffer.append(frame)# 每秒钟结束时判断运动情况if frame_count % 10 == 0:  # 每秒处理一次if non_zero_count > motion_threshold:  # 根据差异判断是否运动print(non_zero_count)print(f"第 {second} 秒有运动")for f in frame_buffer:out.write(f)  # 将帧写入输出视频else:print(f"第 {second} 秒静止")frame_buffer.clear()  # 清空缓冲区准备处理下一秒的帧prev_edges = edges# 释放资源
cap.release()
out.release()
cv2.destroyAllWindows()

开盖即食,大家随便放个运动、静止结合的视频进来,调整一下阈值即可实现动静分离;保留运动的视频,剔除静止的画面

第三个方法,剩下的大家可以用phash等相似度方法同理替换,请查阅我的另一篇文章:
【含泪提速!】一文全解相似度算法、跟踪算法在各个AI场景的应用(附代码)_image.antialias-CSDN博客

三个py的就按测阈值,大家都可以改哦,还有多久判断一次,都可以;

这是实现视频中动静画面区分的;

想要实现一个视频中,哪些画面在东,哪些画面在静止,就可以将画面分成多个区域,分别运算这些个算法,都可以得到哪些地方在动,哪些地方在静止了。

演示效果:原本视频没法上传,原视频15秒,静止部分有5秒,最后处理完后,成功剔除了静止部分的帧,保留下了运动的10秒

最后

最近cv君重新常更,欢迎三连~欢迎大家进入cv君的AI 与计算机视觉世界:DeepAI 视界 里面有几千位AI的朋友,有任何问题都可以交流哦,联系微信zxx15277368495z

这篇关于【开盖即食】多种算法实现画面动静判断(附源码)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1095079

相关文章

C#使用yield关键字实现提升迭代性能与效率

《C#使用yield关键字实现提升迭代性能与效率》yield关键字在C#中简化了数据迭代的方式,实现了按需生成数据,自动维护迭代状态,本文主要来聊聊如何使用yield关键字实现提升迭代性能与效率,感兴... 目录前言传统迭代和yield迭代方式对比yield延迟加载按需获取数据yield break显式示迭

Python实现高效地读写大型文件

《Python实现高效地读写大型文件》Python如何读写的是大型文件,有没有什么方法来提高效率呢,这篇文章就来和大家聊聊如何在Python中高效地读写大型文件,需要的可以了解下... 目录一、逐行读取大型文件二、分块读取大型文件三、使用 mmap 模块进行内存映射文件操作(适用于大文件)四、使用 pand

python实现pdf转word和excel的示例代码

《python实现pdf转word和excel的示例代码》本文主要介绍了python实现pdf转word和excel的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价... 目录一、引言二、python编程1,PDF转Word2,PDF转Excel三、前端页面效果展示总结一

Python xmltodict实现简化XML数据处理

《Pythonxmltodict实现简化XML数据处理》Python社区为提供了xmltodict库,它专为简化XML与Python数据结构的转换而设计,本文主要来为大家介绍一下如何使用xmltod... 目录一、引言二、XMLtodict介绍设计理念适用场景三、功能参数与属性1、parse函数2、unpa

C#实现获得某个枚举的所有名称

《C#实现获得某个枚举的所有名称》这篇文章主要为大家详细介绍了C#如何实现获得某个枚举的所有名称,文中的示例代码讲解详细,具有一定的借鉴价值,有需要的小伙伴可以参考一下... C#中获得某个枚举的所有名称using System;using System.Collections.Generic;usi

Go语言实现将中文转化为拼音功能

《Go语言实现将中文转化为拼音功能》这篇文章主要为大家详细介绍了Go语言中如何实现将中文转化为拼音功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 有这么一个需求:新用户入职 创建一系列账号比较麻烦,打算通过接口传入姓名进行初始化。想把姓名转化成拼音。因为有些账号即需要中文也需要英

C# 读写ini文件操作实现

《C#读写ini文件操作实现》本文主要介绍了C#读写ini文件操作实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录一、INI文件结构二、读取INI文件中的数据在C#应用程序中,常将INI文件作为配置文件,用于存储应用程序的

C#实现获取电脑中的端口号和硬件信息

《C#实现获取电脑中的端口号和硬件信息》这篇文章主要为大家详细介绍了C#实现获取电脑中的端口号和硬件信息的相关方法,文中的示例代码讲解详细,有需要的小伙伴可以参考一下... 我们经常在使用一个串口软件的时候,发现软件中的端口号并不是普通的COM1,而是带有硬件信息的。那么如果我们使用C#编写软件时候,如

Python使用qrcode库实现生成二维码的操作指南

《Python使用qrcode库实现生成二维码的操作指南》二维码是一种广泛使用的二维条码,因其高效的数据存储能力和易于扫描的特点,广泛应用于支付、身份验证、营销推广等领域,Pythonqrcode库是... 目录一、安装 python qrcode 库二、基本使用方法1. 生成简单二维码2. 生成带 Log

Go语言使用Buffer实现高性能处理字节和字符

《Go语言使用Buffer实现高性能处理字节和字符》在Go中,bytes.Buffer是一个非常高效的类型,用于处理字节数据的读写操作,本文将详细介绍一下如何使用Buffer实现高性能处理字节和... 目录1. bytes.Buffer 的基本用法1.1. 创建和初始化 Buffer1.2. 使用 Writ