第一章 基于Ubuntu 24.04 搭建wenet语音转文字

2024-06-22 08:04

本文主要是介绍第一章 基于Ubuntu 24.04 搭建wenet语音转文字,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

系列文章目录

第一章 基于Ubuntu 24.04 搭建wenet语音转文字
第二章 编译运行Android Wenet语音识别


文章目录

  • 系列文章目录
  • 前言
  • 一、Wenet是什么?
  • 二、使用步骤
    • 1.开发安装
    • 2.AAC转换为WAV文件
  • 总结


前言

环境:Ubuntu 24.04+python3.12


一、Wenet是什么?

WeNet是出门问问语音团队联合西工大语音实验室开源的一款面向工业落地应用的语音识别工具包,该工具用一套简洁的方案提供了语音识别从训练到部署的一条龙服务,其主要特点如下:

使用conformer网络结构和CTC/attention  loss联合优化方法,具有业界一流的识别效果。提供云上和端上直接部署的方案,最小化模型训练和产品落地之间的工程工作。框架简洁,模型训练部分完全基于pytorch生态,不依赖于kaldi等安装复杂的工具。详细的注释和文档,十分适合用于学习端到端语音识别的基础知识和实现细节。

Wenet项目地址:https://github.com/wenet-e2e/wenet

二、使用步骤

1.开发安装

在终端中执行

git clone https://github.com/wenet-e2e/wenet.git
cd wenet
pip install -e .

执行pip install -e .提示错误:

error: externally-managed-environment× This environment is externally managed
╰─> To install Python packages system-wide, try apt installpython3-xyz, where xyz is the package you are trying toinstall.If you wish to install a non-Debian-packaged Python package,create a virtual environment using python3 -m venv path/to/venv.Then use path/to/venv/bin/python and path/to/venv/bin/pip. Makesure you have python3-full installed.If you wish to install a non-Debian packaged Python application,it may be easiest to use pipx install xyz, which will manage avirtual environment for you. Make sure you have pipx installed.See /usr/share/doc/python3.12/README.venv for more information.note: If you believe this is a mistake, please contact your Python installation or OS distribution provider. You can override this, at the risk of breaking your Python installation or OS, by passing --break-system-packages.
hint: See PEP 668 for the detailed specification.

这个错误信息表示当前Python环境是由系统外部管理的,通常在某些Linux发行版中(尤其是Debian和基于Debian的系统,比如Ubuntu),系统会强烈建议不要直接使用pip来安装包,以避免与系统包管理器(如apt)的潜在冲突。

解决方案是创建一个虚拟环境,在该环境中可以自由地使用pip安装任何包而不影响系统级别的Python环境。

# 安装python3-venv包,如果还没安装的话
sudo apt install python3-venv# 创建一个新的虚拟环境
python3 -m venv myenv# 激活虚拟环境
source myenv/bin/activate# 现在你可以在虚拟环境中进行安装
pip install -e .

等待下载完成,最后提示安装成功。

在这里插入图片描述

终端内识别音频文件,首次运行会下载 wenetspeech_u2pp_conformer_libtorch.tar.gz

wenet --language chinese audio.wav

识别结果

{'text': '们使用方法扫一扫下载暗学郎被软件注册绑定即可实时接收宝贝在园信息', 'confidence': 0.4810276732848742}

2.AAC转换为WAV文件

手机录音后文件为.aac文件,而wenet不支持此格式,需要转换为wav文件;
在Ubuntu上,你可以使用ffmpeg这个强大的多媒体处理工具来将AAC文件转换为WAV文件。首先,确保你已经安装了ffmpeg。如果没有安装,可以通过以下命令安装:

sudo apt update
sudo apt install ffmpeg

安装完成后,你可以使用以下命令将AAC文件转换为WAV文件:

ffmpeg -i input.aac -c:a pcm_s16le -ar 44100 -ac 2 output.wav

这里的参数解释如下:

  • i input.aac:指定输入的AAC文件。
  • c:a pcm_s16le:指定音频编码器为PCM 16位小端格式。
  • ar 44100:设置采样率为44100 Hz。
  • ac 2:设置声道数为2(立体声)。
  • output.wav:输出的WAV文件名。

确保替换input.aac和output.wav为你的实际文件名。


总结

以上就是今天要讲的内容,本文仅仅简单介绍了wenet的基本搭建与使用,识别准确率还有待提高,替换更好的训练模型数据。

参考:
https://wenet.org.cn/wenet/python_package.html
https://blog.csdn.net/iblade/article/details/135002063

这篇关于第一章 基于Ubuntu 24.04 搭建wenet语音转文字的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1083715

相关文章

如何在Ubuntu 24.04上部署Zabbix 7.0对服务器进行监控

《如何在Ubuntu24.04上部署Zabbix7.0对服务器进行监控》在Ubuntu24.04上部署Zabbix7.0监控阿里云ECS服务器,需配置MariaDB数据库、开放10050/1005... 目录软硬件信息部署步骤步骤 1:安装并配置mariadb步骤 2:安装Zabbix 7.0 Server

Ubuntu如何分配​​未使用的空间

《Ubuntu如何分配​​未使用的空间》Ubuntu磁盘空间不足,实际未分配空间8.2G因LVM卷组名称格式差异(双破折号误写)导致无法扩展,确认正确卷组名后,使用lvextend和resize2fs... 目录1:原因2:操作3:报错5:解决问题:确认卷组名称​6:再次操作7:验证扩展是否成功8:问题已解

如何使用Haporxy搭建Web群集

《如何使用Haporxy搭建Web群集》Haproxy是目前比较流行的一种群集调度工具,同类群集调度工具有很多如LVS和Nginx,本案例介绍使用Haproxy及Nginx搭建一套Web群集,感兴趣的... 目录一、案例分析1.案例概述2.案例前置知识点2.1 HTTP请求2.2 负载均衡常用调度算法 2.

一文详解如何在idea中快速搭建一个Spring Boot项目

《一文详解如何在idea中快速搭建一个SpringBoot项目》IntelliJIDEA作为Java开发者的‌首选IDE‌,深度集成SpringBoot支持,可一键生成项目骨架、智能配置依赖,这篇文... 目录前言1、创建项目名称2、勾选需要的依赖3、在setting中检查maven4、编写数据源5、开启热

Python基于微信OCR引擎实现高效图片文字识别

《Python基于微信OCR引擎实现高效图片文字识别》这篇文章主要为大家详细介绍了一款基于微信OCR引擎的图片文字识别桌面应用开发全过程,可以实现从图片拖拽识别到文字提取,感兴趣的小伙伴可以跟随小编一... 目录一、项目概述1.1 开发背景1.2 技术选型1.3 核心优势二、功能详解2.1 核心功能模块2.

Ubuntu设置程序开机自启动的操作步骤

《Ubuntu设置程序开机自启动的操作步骤》在部署程序到边缘端时,我们总希望可以通电即启动我们写好的程序,本篇博客用以记录如何在ubuntu开机执行某条命令或者某个可执行程序,需要的朋友可以参考下... 目录1、概述2、图形界面设置3、设置为Systemd服务1、概述测试环境:Ubuntu22.04 带图

如何搭建并配置HTTPD文件服务及访问权限控制

《如何搭建并配置HTTPD文件服务及访问权限控制》:本文主要介绍如何搭建并配置HTTPD文件服务及访问权限控制的问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、安装HTTPD服务二、HTTPD服务目录结构三、配置修改四、服务启动五、基于用户访问权限控制六、

pytest+allure环境搭建+自动化实践过程

《pytest+allure环境搭建+自动化实践过程》:本文主要介绍pytest+allure环境搭建+自动化实践过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录一、pytest下载安装1.1、安装pytest1.2、检测是否安装成功二、allure下载安装2.

使用vscode搭建pywebview集成vue项目实践

《使用vscode搭建pywebview集成vue项目实践》:本文主要介绍使用vscode搭建pywebview集成vue项目实践,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录环境准备项目源码下载项目说明调试与生成可执行文件核心代码说明总结本节我们使用pythonpywebv

Windows Server 2025 搭建NPS-Radius服务器的步骤

《WindowsServer2025搭建NPS-Radius服务器的步骤》本文主要介绍了通过微软的NPS角色实现一个Radius服务器,身份验证和证书使用微软ADCS、ADDS,具有一定的参考价... 目录简介示意图什么是 802.1X?核心作用802.1X的组成角色工作流程简述802.1X常见应用802.