Montreal Forced Aligner (MFA)安装教程及异常处理

2024-02-12 05:18

本文主要是介绍Montreal Forced Aligner (MFA)安装教程及异常处理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

官方地址:https://montreal-forced-aligner.readthedocs.io/en/latest/index.html

文末附常见问题解决方法:

1、FileNotFoundError: [Errno 2] No such file or directory: ‘xxx/MFA/LJSpeech_raw/corpus_data/split1/feats.0.scp’
2、kaldi包不匹配,大致描述是 mfa thirdparty kaldi


1、MFA简介

Forced alignment is a technique to take an orthographic transcription of an audio file and generate a time-aligned version using a pronunciation dictionary to look up phones for words.

Montreal Forced Aligner (MFA),一种强制对齐工具,用来生成音频 音素时长的工具

2、安装

具体请参考:

MFA installation

需要安装conda/miniconda,视系统版本还需要安装kaldi。

这里以Ubuntu 18.04为例(其它的OS会有些许不同,参考上面的网页),介绍大致的步骤:

(1)安装Anaconda或者Miniconda

Miniconda

(2)切换环境

conda create -n aligner -c conda-forge openblas python=3.8 openfst pynini ngram baumwelch

完成之后确保你在新的环境

conda activate aligner

(3)安装MFA

pip install montreal-forced-aligner

前面都比较正常,没有遇到异常

(4)安装第三方包

mfa thirdparty download

这一步出现了报错:报错是网络 connect 问题,显示 raw.githubusercontent.com 访问不上,一致进入本地,然后自己添加 hosts 进行了重定向进行了解决, 此包比较大,所以需要一些时间进行下载

(5)安装sox(可选)

安装方法请自行搜索。

其实安装sox主要是为了能align除.wav格式之外的文件,如果你不需要的话则可以省略这一步。

(6)升级到最新版

首先确保你在新的环境(aligner),然后执行:

pip install montreal-forced-aligner -U

出现

-- Requirement already satisfied:xxx --

这里一般可以跳过(
到这里就大致结束了,如果你的系统版本较低,需要安装kaldi,参考:

Kaldi github

安装结束之后执行:

mfa thirdparty kaldi /path/to/kaldi/repo

最后执行:

mfa thirdparty validate

来验证安装是否成功。
正常会显示:
All required kaldi binaries were found!

所有步骤结束之后执行:

mfa version

可以看到目前的版本。

如,显示
2.0.0a24

OK,安装成功。(不过可能还是会出现库的兼容问题,如下文的两种常见问题)

部分参考:
https://zhuanlan.zhihu.com/p/386884727


安装中常见问题:

1、FileNotFoundError: [Errno 2] No such file or directory: 'xxx/MFA/LJSpeech_raw/corpus_data/split1/feats.0.scp’

sudo apt-get install libatlas3-base
and
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$HOME/anaconda3/envs/aligner/lib/
注意,上面的需要改成自己的虚拟环境路径 $HOME/anaconda3/envs/aligner/lib/,通过 which mfa 查看,然后进行替换,例如 /opt/anaconda3/envs/aligner/lib
如果需要永久写入,修改bash: vi ~/.bashrc
添加行 export xxxx
参考:https://github.com/MontrealCorpusTools/Montreal-Forced-Aligner/issues/217

2、kaldi包不匹配
大致描述是 mfa thirdparty kaldi

这种情况下就需要进行重新编译,安装,然后重定向:
参考(https://githubmemory.com/repo/MontrealCorpusTools/Montreal-Forced-Aligner/issues/311)

根据官网的 INSTALL,主要分为两步:https://github.com/kaldi-asr/kaldi

①进入 tools 指导安装
在这里插入图片描述
过程中可能会遇到 下载中断问题,建议直接手动下载然后上传到当前目录(即 tools) 里面,方便顺利编译!
② 进入src ,根据INSTALL进行
在这里插入图片描述
建议使用 -j 8 进行加速
完成时,注意记录 kaldi 新的安装路径,用于后面的重新建立新连接,正常情况下,最后完成会出现:
make[1]: Leaving directory 'xxx/xxx/xxx/kaldi/kaldi-master
上面的目录就是我们要定向的目录了,完成 kaldi 安装后:
mfa thirdparty kaldi /home/xxx/xxx/kaldi 即可

重新运行:
在这里插入图片描述
运行成功!

这篇关于Montreal Forced Aligner (MFA)安装教程及异常处理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/701743

相关文章

Python使用国内镜像加速pip安装的方法讲解

《Python使用国内镜像加速pip安装的方法讲解》在Python开发中,pip是一个非常重要的工具,用于安装和管理Python的第三方库,然而,在国内使用pip安装依赖时,往往会因为网络问题而导致速... 目录一、pip 工具简介1. 什么是 pip?2. 什么是 -i 参数?二、国内镜像源的选择三、如何

Ubuntu固定虚拟机ip地址的方法教程

《Ubuntu固定虚拟机ip地址的方法教程》本文详细介绍了如何在Ubuntu虚拟机中固定IP地址,包括检查和编辑`/etc/apt/sources.list`文件、更新网络配置文件以及使用Networ... 1、由于虚拟机网络是桥接,所以ip地址会不停地变化,接下来我们就讲述ip如何固定 2、如果apt安

Python安装时常见报错以及解决方案

《Python安装时常见报错以及解决方案》:本文主要介绍在安装Python、配置环境变量、使用pip以及运行Python脚本时常见的错误及其解决方案,文中介绍的非常详细,需要的朋友可以参考下... 目录一、安装 python 时常见报错及解决方案(一)安装包下载失败(二)权限不足二、配置环境变量时常见报错及

PyCharm 接入 DeepSeek最新完整教程

《PyCharm接入DeepSeek最新完整教程》文章介绍了DeepSeek-V3模型的性能提升以及如何在PyCharm中接入和使用DeepSeek进行代码开发,本文通过图文并茂的形式给大家介绍的... 目录DeepSeek-V3效果演示创建API Key在PyCharm中下载Continue插件配置Con

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

在不同系统间迁移Python程序的方法与教程

《在不同系统间迁移Python程序的方法与教程》本文介绍了几种将Windows上编写的Python程序迁移到Linux服务器上的方法,包括使用虚拟环境和依赖冻结、容器化技术(如Docker)、使用An... 目录使用虚拟环境和依赖冻结1. 创建虚拟环境2. 冻结依赖使用容器化技术(如 docker)1. 创

Spring Boot整合log4j2日志配置的详细教程

《SpringBoot整合log4j2日志配置的详细教程》:本文主要介绍SpringBoot项目中整合Log4j2日志框架的步骤和配置,包括常用日志框架的比较、配置参数介绍、Log4j2配置详解... 目录前言一、常用日志框架二、配置参数介绍1. 日志级别2. 输出形式3. 日志格式3.1 PatternL

MySQL8.2.0安装教程分享

《MySQL8.2.0安装教程分享》这篇文章详细介绍了如何在Windows系统上安装MySQL数据库软件,包括下载、安装、配置和设置环境变量的步骤... 目录mysql的安装图文1.python访问网址2javascript.点击3.进入Downloads向下滑动4.选择Community Server5.

使用C++将处理后的信号保存为PNG和TIFF格式

《使用C++将处理后的信号保存为PNG和TIFF格式》在信号处理领域,我们常常需要将处理结果以图像的形式保存下来,方便后续分析和展示,C++提供了多种库来处理图像数据,本文将介绍如何使用stb_ima... 目录1. PNG格式保存使用stb_imagephp_write库1.1 安装和包含库1.2 代码解

CentOS系统Maven安装教程分享

《CentOS系统Maven安装教程分享》本文介绍了如何在CentOS系统中安装Maven,并提供了一个简单的实际应用案例,安装Maven需要先安装Java和设置环境变量,Maven可以自动管理项目的... 目录准备工作下载并安装Maven常见问题及解决方法实际应用案例总结Maven是一个流行的项目管理工具