Windows使用ffmpeg获取麦克风数据

2024-09-04 02:44

本文主要是介绍Windows使用ffmpeg获取麦克风数据,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 前言
  • 一、安装MSYS2
  • 二、开始配置
  • 三、测试代码
  • 四、缺陷
  • 总结


前言

最近突发奇想,既然ffmpeg那么好用,为什么不能拿到Windows上来用呢?由于ffmpeg官方提供的是二进制文件,不是开发库。之前尝试过很多次移植都失败了,当我准备放弃的时候,突然一次意外发现让我重燃希望。所以ffmpeg在windows上到底好不好用呢?让我们拭目以待吧。

OS:WIndows11
ffmpeg:7.0


一、安装MSYS2

今天说的这个方法可以说依赖这个环境,而环境的安装我已经在另一篇文章中说过了,这里就不再赘述了。

Windows上MSYS2的安装和使用

二、开始配置

这种方法需要安装ffmpeg,使用mingw64环境。

pacman -S mingw-w64-x86_64-ffmpeg

三、测试代码

绝大多数代码都可以和Linux通用,只有细节部分必须分开来。我们在Linux上可以使用alsapulse来获取声音系统;在Windows上可以使用dshow来获取声音系统,windows系统上貌似ffmpeg只支持dshow这一种方式。

ffmpeg_windows.cpp

#include <iostream>
#include <cstdio>extern "C" {
#include <libavformat/avformat.h>
#include <libavdevice/avdevice.h>
}/*** @author arnold* @brief use alsa and default device* */
void read_microphone() {
//    av_version_info();
//    av_register_all();//ffmpeg 3.x versionavdevice_register_all();AVFormatContext *fmt_ctx = nullptr;auto *input_fmt = const_cast<AVInputFormat *>(av_find_input_format("dshow")); // 音频设备的输入格式,如alsa、pulse等const char *dev_name = R"(audio=麦克风阵列 (英特尔® 智音技术))"; // microphone device nameAVDictionary *format_opts = nullptr;//set stream format options
//    av_dict_set(&format_opts, "sample_rate", "16000", 0);//set audio sample
//    av_dict_set(&format_opts, "sample_size", "16", 0);//set audio sample
//    av_dict_set(&format_opts, "channels", "1", 0);//set audio channel
//    av_dict_set(&format_opts, "fragment_size", "256", 0);//set audio fragment size// open audio deviceif (avformat_open_input(&fmt_ctx, dev_name, input_fmt, &format_opts) != 0) {printf("can't open input device!\n");if (format_opts)av_dict_free(&format_opts);return;}if (format_opts)av_dict_free(&format_opts);//Output Info---printf("---------------- File Information ---------------\n");av_dump_format(fmt_ctx, 0, dev_name, 0);printf("-------------------------------------------------\n");// find audio stream infoif (avformat_find_stream_info(fmt_ctx, nullptr) < 0) {printf("can't get audio stream info!\n");return;}int audio_stream_idx = -1;// find audio stream indexfor (int i = 0; i < fmt_ctx->nb_streams; i++) {if (fmt_ctx->streams[i]->codecpar->codec_type == AVMEDIA_TYPE_AUDIO) {audio_stream_idx = i;break;}}if (audio_stream_idx == -1) {printf("can't find audio stream index!\n");return;}AVPacket packet;while (av_read_frame(fmt_ctx, &packet) >= 0) {if (packet.stream_index == audio_stream_idx) {std::cout << "packet size: " << packet.size << std::endl;std::cout << "packet duration: " << packet.duration << std::endl;}av_packet_unref(&packet);}avformat_close_input(&fmt_ctx);
}int main() {read_microphone();return 0;
}

CmakeLists.txt

cmake_minimum_required(VERSION 3.10)
project(read_microphone)set(CMAKE_CXX_STANDARD 11)if (UNIX)message(STATUS "OS is UNiX")find_package(PkgConfig REQUIRED)pkg_check_modules(ffmpeg_lib REQUIRED IMPORTED_TARGET libavformat libavutil libavdevice libavcodec)add_executable(ffmpeg_unix ffmpeg_unix.cpp)target_link_libraries(ffmpeg_unix PkgConfig::ffmpeg_lib)pkg_check_modules(alsa_lib REQUIRED IMPORTED_TARGET alsa)add_executable(alsa_bin alsa_lib.cpp)target_link_libraries(alsa_bin PkgConfig::alsa_lib)add_executable(pcm_2_wav pcm_2_wav.cpp)target_link_libraries(pcm_2_wav PkgConfig::alsa_lib PkgConfig::ffmpeg_lib)
elseif (WIN32)message(STATUS "OS is Windows")find_package(PkgConfig REQUIRED)pkg_check_modules(ffmpeg_lib REQUIRED IMPORTED_TARGET libavformat libavutil libavdevice)add_executable(ffmpeg_windows ffmpeg_windows.cpp)target_link_libraries(ffmpeg_windows PkgConfig::ffmpeg_lib)
endif ()

这种模式下Cmake不需要进行任何更改,和Linux上是一模一样的。唯二的差别就是input_format必须选dshowdevice必须是确切的名字才行。这一点和Linux不一样,Linux上可以选default,就是你勾选的默认麦克风,这一点差别还蛮大的。

至于怎么查看Windows上的麦克风设备,请执行以下的命令:

ffmpeg -f dshow -list_devices true -i dummy[dshow @ 000001765c475840] "HP HD Camera" (video)
[dshow @ 000001765c475840]   Alternative name "@device_pnp_\\?\usb#vid_30c9&pid_0009&mi_00#6&23fdf108&1&0000#{65e8773d-8f56-11d0-a3b9-00a0c9223196}\global"
[dshow @ 000001765c475840] "麦克风阵列 (英特尔® 智音技术)" (audio)
[dshow @ 000001765c475840]   Alternative name "@device_cm_{33D9A762-90C8-11D0-BD43-00A0C911CE86}\wave_{8730737C-26AF-44E6-A535-1A478CFB2509}"
[dshow @ 000001765c475840] "麦克风 (ToDesk Virtual Audio)" (audio)
[dshow @ 000001765c475840]   Alternative name "@device_cm_{33D9A762-90C8-11D0-BD43-00A0C911CE86}\wave_{C8461EAB-1635-4144-BE61-6BDC555C9B16}"

括号里带(audio)都是麦克风设备,带(video)的都是摄像头设备。

命令行测试麦克风:

ffmpeg -f dshow -i audio="麦克风阵列 (英特尔® 智音技术)" -f null -#或
ffmpeg -f dshow -i audio="@device_cm_{33D9A762-90C8-11D0-BD43-00A0C911CE86}\wave_{8730737C-26AF-44E6-A535-1A478CFB2509}" -f null -

同样的代码里填这两种名字都行,就是不能用default

四、缺陷

感觉也不算缺陷,但是它就是不支持,看我代码里注释掉的代码。sample_rate可以设置但是不能随便设置,比如32000HZ44100HZ48000HZ都是可以的,但是有些需要的16000HZ就不行。

下面的命令报错:

ffmpeg -sample_rate 16000 -f dshow -i audio="@device_cm_{33D9A762-90C8-11D0-BD43-00A0C911CE86}\wave_{8730737C-26AF-44E6-A535-1A478CFB2509}" -f null -

下面的命令可以:

ffmpeg -sample_rate 32000-f dshow -i audio="@device_cm_{33D9A762-90C8-11D0-BD43-00A0C911CE86}\wave_{8730737C-26AF-44E6-A535-1A478CFB2509}" -f null -

实际上WIndows原生的获取麦克风声音的方法也不是都支持随便设置采样率的,感兴趣的可以试试。

问题是同样的硬件alsa和pulse都支持设置16000的采样率,会给出警告但不会报错。虽说,16000的采样率绝大多数场景用不到,但是有些声音识别的算法就用16000的采样率,真的是头疼。如果你知道方法,麻烦你在回复里告诉我,我感激不尽。

当然,也可以通过后期处理来转化解决。毕竟转换声音没有转换图像那么消耗性能。


总结

1、美中不足,但是对于快速开发足够了,毕竟我觉得ffmpeg还是比自带的好用一些,不知道是不是错觉。

这篇关于Windows使用ffmpeg获取麦克风数据的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1134776

相关文章

Java中String字符串使用避坑指南

《Java中String字符串使用避坑指南》Java中的String字符串是我们日常编程中用得最多的类之一,看似简单的String使用,却隐藏着不少“坑”,如果不注意,可能会导致性能问题、意外的错误容... 目录8个避坑点如下:1. 字符串的不可变性:每次修改都创建新对象2. 使用 == 比较字符串,陷阱满

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

使用C++实现链表元素的反转

《使用C++实现链表元素的反转》反转链表是链表操作中一个经典的问题,也是面试中常见的考题,本文将从思路到实现一步步地讲解如何实现链表的反转,帮助初学者理解这一操作,我们将使用C++代码演示具体实现,同... 目录问题定义思路分析代码实现带头节点的链表代码讲解其他实现方式时间和空间复杂度分析总结问题定义给定

Linux使用nload监控网络流量的方法

《Linux使用nload监控网络流量的方法》Linux中的nload命令是一个用于实时监控网络流量的工具,它提供了传入和传出流量的可视化表示,帮助用户一目了然地了解网络活动,本文给大家介绍了Linu... 目录简介安装示例用法基础用法指定网络接口限制显示特定流量类型指定刷新率设置流量速率的显示单位监控多个

JavaScript中的reduce方法执行过程、使用场景及进阶用法

《JavaScript中的reduce方法执行过程、使用场景及进阶用法》:本文主要介绍JavaScript中的reduce方法执行过程、使用场景及进阶用法的相关资料,reduce是JavaScri... 目录1. 什么是reduce2. reduce语法2.1 语法2.2 参数说明3. reduce执行过程

如何使用Java实现请求deepseek

《如何使用Java实现请求deepseek》这篇文章主要为大家详细介绍了如何使用Java实现请求deepseek功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1.deepseek的api创建2.Java实现请求deepseek2.1 pom文件2.2 json转化文件2.2

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

C++ Primer 多维数组的使用

《C++Primer多维数组的使用》本文主要介绍了多维数组在C++语言中的定义、初始化、下标引用以及使用范围for语句处理多维数组的方法,具有一定的参考价值,感兴趣的可以了解一下... 目录多维数组多维数组的初始化多维数组的下标引用使用范围for语句处理多维数组指针和多维数组多维数组严格来说,C++语言没

在 Spring Boot 中使用 @Autowired和 @Bean注解的示例详解

《在SpringBoot中使用@Autowired和@Bean注解的示例详解》本文通过一个示例演示了如何在SpringBoot中使用@Autowired和@Bean注解进行依赖注入和Bean... 目录在 Spring Boot 中使用 @Autowired 和 @Bean 注解示例背景1. 定义 Stud

使用 sql-research-assistant进行 SQL 数据库研究的实战指南(代码实现演示)

《使用sql-research-assistant进行SQL数据库研究的实战指南(代码实现演示)》本文介绍了sql-research-assistant工具,该工具基于LangChain框架,集... 目录技术背景介绍核心原理解析代码实现演示安装和配置项目集成LangSmith 配置(可选)启动服务应用场景