kaldi 中run_ivector_common

2024-08-29 08:32
文章标签 run common kaldi ivector

本文主要是介绍kaldi 中run_ivector_common,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

kaldi 中run_ivector_common.sh

在使用GMM-HMM对音频和文本进行对齐之后,在使用DNN网络的时候,kaldi中会加入说话人信息,一般用ivector特征,kaldi中run_ivector_common.sh 对特征做了进一步的处理:

  • 对特征进行速度上的扰动处理
# perturb the normal data to get the alignment _sp stands for speed-perturbed
utils/data/perturb_data_dir_speed_3way.sh data/${train_set} data/${train_set}_sp

结果,一般是对速度进行0.9、1.0、1.1的扰动处理

sp1.1-00000349544890655844_0-3083248710_0001 sox -t wav /data1/speechResource/run8k-train/ctrip_cancel/20190907/wavs/00000349544890655844_0/00000349544890655844_0-3083248710_0001.wav -t wav - speed 1.1 |
sp1.1-00000349544890655844_0-3083248722_0011 sox -t wav /data1/speechResource/run8k-train/ctrip_cancel/20190907/wavs/00000349544890655844_0/00000349544890655844_0-3083248722_0011.wav -t wav - speed 1.1 |
  • 音量进行扰动
  # do volume-perturbation on the training data prior to extracting hires# features; this helps make trained nnets more invariant to test data volume.utils/data/perturb_data_dir_volume.sh data/${train_set}_sp_hires$online_affix || exit 1;
  • 00000301430623824267_0-784002119_0004 sox --vol 0.913571714058 -t wav /data1/speechResource/run8k-train/ctrip_ivr/20190506/wavs/00000301430623824267_0/00000301430623824267_0-784002119_0004.wav -t wav - |
    00000301430623824267_0-784002122_0007 sox --vol 0.610468906799 -t wav /data1/speechResource/run8k-train/ctrip_ivr/20190506/wavs/00000301430623824267_0/00000301430623824267_0-784002122_0007.wav -t wav - |

这篇关于kaldi 中run_ivector_common的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1117360

相关文章

python subprocess.run中的具体使用

《pythonsubprocess.run中的具体使用》subprocess.run是Python3.5及以上版本中用于运行子进程的函数,它提供了更简单和更强大的方式来创建和管理子进程,本文就来详细... 目录一、详解1.1、基本用法1.2、参数详解1.3、返回值1.4、示例1.5、总结二、subproce

兔子--Android Studio出现错误:Error:Execution failed for task ':myapp:dexDebug'. com.android.ide.common.pro

重点在:finished with non-zero exit value 2. 这里表明了有重复的内容存在。 由于:Android Studio中引入包的方式有如下2种:    compile 'com.android.support:support-v4:22.0.0'    compile files('libs/support-v

[vue小白]npm run运行以后无法关闭

开启vue任务后,关闭git bash窗口发现端口仍然被占用,程序没有关闭 通过查询资料,大部分都说ctrl+c就可以了,但是经过实践发现并不可行,目测大部分都是复制粘贴的答案。 经过尝试,最终发现可能只能暴力关闭了 1.在cmd中输入netstat -ano查询占用端口号的pid 2. 然后在任务管理器中查询对应的任务并关闭 3. 在linux系统中更简单,直接kill -9 pid即可

YOLOV5入门教学-common.py文件

在 YOLOv5 框架中,common.py 文件是一个核心组件,负责定义深度学习模型的基础模块和常用操作。无论是卷积层、激活函数、特征融合还是其他复杂的模型结构,common.py 都提供了灵活且高效的实现。在这篇文章中,我们将深入解析 common.py 的设计思想、各个模块的功能以及它在 YOLOv5 中的应用。通过理解该文件的实现细节,不仅可以帮助我们更好地掌握 YOLOv5 的内部结构,

eclipse里maven debug-tomcat:run注意

eclipse里maven debug-tomcat:run注意: 源码调试需要插件:m2e.sourcelookup 在eclipse上 Help->install new software  https://bjmi.github.io/update-site/

【UVALive】3661 Animal Run 平面图最小割 最短路

传送门:【UVALive】3661 Animal Run 题目大意:给你一个n*m个点的网格图,其中动物园在左上角,动物们的目的地在右下角,现在你需要派出一些工作人员拦截某些边使得没有一只动物能到达右下角,已知每个单元网格中存在左上角到右下角的对角线,网格中的边以及对角线都是双向的,每条道路有个权值,表示拦截这条边所需要的工作人员数。你的任务是派尽量少的工作人员使得达到目的。 题目分析

【docker无法启动】 can't create unix socket /var/run/docker.sock: is a directory

一次重启docker后出现的问题 Oct 18 19:18:20 worker systemd[1]: Starting Docker Application Container Engine...Oct 18 19:18:20 worker1 dockerd-current[118257]: time="2018-10-18T19:18:20.734668371+08:00" level=w

网络协议栈学习之socket, sock_common, sock, 和 sk_buff

一. 前言   一直很好奇socket是如何实现的,底层的数据结构又是如何,因此在这里对socket的数据结构进行分析。   socket是传输层使用的数据结构,用于声明、定义套接字,网络层会调用sock结构体,其中sock会用到了通用sock_common结构体。而sk_buff则是内核中使用的套接字缓冲区结构体。在我们前文提到的NAT转换中,除了修改内核已有的Netfilter源码外,还有一

Netfilter学习之NAT类型动态配置(八)nf_nat_proto_common.c代码解析

nf_nat_proto_common.c实现了对称型的端口改变,在此我决定对其代码进行分析,以便实现对对称型NAT的随意改动。    具体代码如下: #include <linux/types.h>#include <linux/random.h>#include <linux/netfilter.h>#include <linux/export.h>#include <net/n

QT---QtConcurrent---Run

1.QtConcurrent QtConcurrent 是命名空间 (namespace),它提供了高层次的函数接口 (APIs),可根据计算机的 CPU 核数,自动调整运行的线程数目。 模块:concurrent 2.run() QFuture<T> run(Function, ...) Function 必须是指向函数的指针,函数返回T型对象。省略号代表变量参数列表,如果给出参数,这