本文主要是介绍视频中有无声音的检测,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
最近遇到一个烦心的事,晚上车停在路边车窗被砸了,行车记录仪正好没安装好,没有拍到,需要对视频声音进行分析确定被砸时间,但我的行车记录仪是每一分钟拍一个视频,一晚上的视频非常多,听起来非常浪费时间,废话不多说,开干。这里提供一个视频中有无声音的检测用例:
import os
import subprocess
import librosa
import numpy as npdef extract_audio_from_video(video_file_path, output_audio_file_path):# 使用ffmpeg提取音频try:subprocess.run(['ffmpeg', '-i', video_file_path, '-vn', '-acodec', 'pcm_s16le', '-ar', '44100', '-ac', '2', output_audio_file_path], check=True)except subprocess.CalledProcessError as e:print(f"提取音频时出现错误: {e}")def main():# 视频文件路径video_file_path = r"D:\Viidure\2024_03_11_201220_00.MP4"# 临时音频文件路径temp_audio_file_path = r"D:\Viidure\temp_audio.wav"# 提取音频extract_audio_from_video(video_file_path, temp_audio_file_path)# 加载音频文件try:y, sr = librosa.load(temp_audio_file_path, sr=None) # sr=None 表示使用音频文件的原始采样率except Exception as e:print(f"加载音频文件时出现错误: {e}")return# 计算梅尔频谱图S = librosa.feature.melspectrogram(y=y, sr=sr, n_mels=128)# 计算音频频谱的分贝值loudness = librosa.power_to_db(S, ref=np.max(S))# 获取频率轴frequencies = librosa.core.fft_frequencies(sr=sr)# 检查每个频率的声音强度是否在人耳的听觉范围内for f, dB in zip(frequencies, loudness):# print(type(f))# print(type(dB))if 2000 <= f <= 20000:if np.any(dB > -40): # -40 dB作为听觉阈值的一个参考# print("------------------------------------------------------")print(f"频率 {f} Hz ,人耳能够听见。")# else:# print("------------------------------------------------------")# print(f"频率 {f} Hz 的声音强度为 {dB} dB,低于听觉阈值。")# print("------------------------------------------------------")# 删除临时音频文件try:os.remove(temp_audio_file_path)except Exception as e:print(f"删除临时音频文件时出现错误: {e}")if __name__ == "__main__":main()
这篇关于视频中有无声音的检测的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!