Montreal Forced Aligner (MFA)安装教程及异常处理

2024-02-12 05:18

本文主要是介绍Montreal Forced Aligner (MFA)安装教程及异常处理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

官方地址:https://montreal-forced-aligner.readthedocs.io/en/latest/index.html

文末附常见问题解决方法:

1、FileNotFoundError: [Errno 2] No such file or directory: ‘xxx/MFA/LJSpeech_raw/corpus_data/split1/feats.0.scp’
2、kaldi包不匹配,大致描述是 mfa thirdparty kaldi


1、MFA简介

Forced alignment is a technique to take an orthographic transcription of an audio file and generate a time-aligned version using a pronunciation dictionary to look up phones for words.

Montreal Forced Aligner (MFA),一种强制对齐工具,用来生成音频 音素时长的工具

2、安装

具体请参考:

MFA installation

需要安装conda/miniconda,视系统版本还需要安装kaldi。

这里以Ubuntu 18.04为例(其它的OS会有些许不同,参考上面的网页),介绍大致的步骤:

(1)安装Anaconda或者Miniconda

Miniconda

(2)切换环境

conda create -n aligner -c conda-forge openblas python=3.8 openfst pynini ngram baumwelch

完成之后确保你在新的环境

conda activate aligner

(3)安装MFA

pip install montreal-forced-aligner

前面都比较正常,没有遇到异常

(4)安装第三方包

mfa thirdparty download

这一步出现了报错:报错是网络 connect 问题,显示 raw.githubusercontent.com 访问不上,一致进入本地,然后自己添加 hosts 进行了重定向进行了解决, 此包比较大,所以需要一些时间进行下载

(5)安装sox(可选)

安装方法请自行搜索。

其实安装sox主要是为了能align除.wav格式之外的文件,如果你不需要的话则可以省略这一步。

(6)升级到最新版

首先确保你在新的环境(aligner),然后执行:

pip install montreal-forced-aligner -U

出现

-- Requirement already satisfied:xxx --

这里一般可以跳过(
到这里就大致结束了,如果你的系统版本较低,需要安装kaldi,参考:

Kaldi github

安装结束之后执行:

mfa thirdparty kaldi /path/to/kaldi/repo

最后执行:

mfa thirdparty validate

来验证安装是否成功。
正常会显示:
All required kaldi binaries were found!

所有步骤结束之后执行:

mfa version

可以看到目前的版本。

如,显示
2.0.0a24

OK,安装成功。(不过可能还是会出现库的兼容问题,如下文的两种常见问题)

部分参考:
https://zhuanlan.zhihu.com/p/386884727


安装中常见问题:

1、FileNotFoundError: [Errno 2] No such file or directory: 'xxx/MFA/LJSpeech_raw/corpus_data/split1/feats.0.scp’

sudo apt-get install libatlas3-base
and
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$HOME/anaconda3/envs/aligner/lib/
注意,上面的需要改成自己的虚拟环境路径 $HOME/anaconda3/envs/aligner/lib/,通过 which mfa 查看,然后进行替换,例如 /opt/anaconda3/envs/aligner/lib
如果需要永久写入,修改bash: vi ~/.bashrc
添加行 export xxxx
参考:https://github.com/MontrealCorpusTools/Montreal-Forced-Aligner/issues/217

2、kaldi包不匹配
大致描述是 mfa thirdparty kaldi

这种情况下就需要进行重新编译,安装,然后重定向:
参考(https://githubmemory.com/repo/MontrealCorpusTools/Montreal-Forced-Aligner/issues/311)

根据官网的 INSTALL,主要分为两步:https://github.com/kaldi-asr/kaldi

①进入 tools 指导安装
在这里插入图片描述
过程中可能会遇到 下载中断问题,建议直接手动下载然后上传到当前目录(即 tools) 里面,方便顺利编译!
② 进入src ,根据INSTALL进行
在这里插入图片描述
建议使用 -j 8 进行加速
完成时,注意记录 kaldi 新的安装路径,用于后面的重新建立新连接,正常情况下,最后完成会出现:
make[1]: Leaving directory 'xxx/xxx/xxx/kaldi/kaldi-master
上面的目录就是我们要定向的目录了,完成 kaldi 安装后:
mfa thirdparty kaldi /home/xxx/xxx/kaldi 即可

重新运行:
在这里插入图片描述
运行成功!

这篇关于Montreal Forced Aligner (MFA)安装教程及异常处理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/701743

相关文章

Ubuntu中远程连接Mysql数据库的详细图文教程

《Ubuntu中远程连接Mysql数据库的详细图文教程》Ubuntu是一个以桌面应用为主的Linux发行版操作系统,这篇文章主要为大家详细介绍了Ubuntu中远程连接Mysql数据库的详细图文教程,有... 目录1、版本2、检查有没有mysql2.1 查询是否安装了Mysql包2.2 查看Mysql版本2.

Win11安装PostgreSQL数据库的两种方式详细步骤

《Win11安装PostgreSQL数据库的两种方式详细步骤》PostgreSQL是备受业界青睐的关系型数据库,尤其是在地理空间和移动领域,:本文主要介绍Win11安装PostgreSQL数据库的... 目录一、exe文件安装 (推荐)下载安装包1. 选择操作系统2. 跳转到EDB(PostgreSQL 的

Python FastAPI+Celery+RabbitMQ实现分布式图片水印处理系统

《PythonFastAPI+Celery+RabbitMQ实现分布式图片水印处理系统》这篇文章主要为大家详细介绍了PythonFastAPI如何结合Celery以及RabbitMQ实现简单的分布式... 实现思路FastAPI 服务器Celery 任务队列RabbitMQ 作为消息代理定时任务处理完整

Elasticsearch 在 Java 中的使用教程

《Elasticsearch在Java中的使用教程》Elasticsearch是一个分布式搜索和分析引擎,基于ApacheLucene构建,能够实现实时数据的存储、搜索、和分析,它广泛应用于全文... 目录1. Elasticsearch 简介2. 环境准备2.1 安装 Elasticsearch2.2 J

Linux系统中卸载与安装JDK的详细教程

《Linux系统中卸载与安装JDK的详细教程》本文详细介绍了如何在Linux系统中通过Xshell和Xftp工具连接与传输文件,然后进行JDK的安装与卸载,安装步骤包括连接Linux、传输JDK安装包... 目录1、卸载1.1 linux删除自带的JDK1.2 Linux上卸载自己安装的JDK2、安装2.1

C#使用SQLite进行大数据量高效处理的代码示例

《C#使用SQLite进行大数据量高效处理的代码示例》在软件开发中,高效处理大数据量是一个常见且具有挑战性的任务,SQLite因其零配置、嵌入式、跨平台的特性,成为许多开发者的首选数据库,本文将深入探... 目录前言准备工作数据实体核心技术批量插入:从乌龟到猎豹的蜕变分页查询:加载百万数据异步处理:拒绝界面

Linux卸载自带jdk并安装新jdk版本的图文教程

《Linux卸载自带jdk并安装新jdk版本的图文教程》在Linux系统中,有时需要卸载预装的OpenJDK并安装特定版本的JDK,例如JDK1.8,所以本文给大家详细介绍了Linux卸载自带jdk并... 目录Ⅰ、卸载自带jdkⅡ、安装新版jdkⅠ、卸载自带jdk1、输入命令查看旧jdkrpm -qa

Java使用Curator进行ZooKeeper操作的详细教程

《Java使用Curator进行ZooKeeper操作的详细教程》ApacheCurator是一个基于ZooKeeper的Java客户端库,它极大地简化了使用ZooKeeper的开发工作,在分布式系统... 目录1、简述2、核心功能2.1 CuratorFramework2.2 Recipes3、示例实践3

Springboot处理跨域的实现方式(附Demo)

《Springboot处理跨域的实现方式(附Demo)》:本文主要介绍Springboot处理跨域的实现方式(附Demo),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不... 目录Springboot处理跨域的方式1. 基本知识2. @CrossOrigin3. 全局跨域设置4.

springboot简单集成Security配置的教程

《springboot简单集成Security配置的教程》:本文主要介绍springboot简单集成Security配置的教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录集成Security安全框架引入依赖编写配置类WebSecurityConfig(自定义资源权限规则