cmus专题

CMUS狮身人面像(四)-构建语言模型

构建语言模型 语言模型是配置的重要组成部分,它告诉解码器可以识别哪些单词序列。 模型有多种类型:关键词列表、语法和统计语言模型以及语音语言模型。它们具有不同的功能和性能特性。您可以根据需要选择任何解码模式,甚至可以在运行时在模式之间切换。有关更多详细信息,请参阅Pocketsphinx 教程。 关键词列表 Pocketsphinx 支持关键字发现模式,您可以在其中指定要查找的关键字列表。这

CMUS狮身人面像(六)-调整语音识别准确性

调整语音识别准确性 精度差的原因测试数据库设置运行测试 语音识别的准确性并不总是很高。 首先,重要的是要了解您的准确性是否只是低于预期,还是总体上非常低。如果总体精度非常低,则您很可能错误配置了解码器。如果低于预期,可以采用各种方法来改进。 您应该做的第一件事是收集测试样本数据库并测量识别准确性。您需要将话语转储到 wav 文件中,编写参考文本并使用解码器对其进行解码。然后使用 S

CMUS狮身人面像(一)-开发人员教程

CMUSphinx 开发人员教程 介绍 本教程将介绍 CMUSphinx 工具包的一些应用程序。此类应用程序可能包括移动、桌面或汽车应用程序的语音控制、语言学习、语音转录、隐藏式字幕、语音翻译或语音搜索。虽然所有这些应用程序都可以通过 CMUSphinx 实现,但现代工具包(例如Kaldi、 Coqui、 NeMo、 Wav2vec2、 Whisper和 Whisper.cpp等)在处理较大词

Linux 命令行播放器Cmus

cmus是一个小巧精致命令行音乐播放器。 启动cmus只需要在shell中输入cmus 添加目录:a /home/gudi/music 按Tab 键在艺术家/专辑和曲目选择之间切换 选中播放 “Enter”  本曲从头播放 “x” 暂停/播放 “c” 向下选择 “j” 向上选择 “k” 切换时间条格式 “t”   当前时间/还剩时间 步退 “h” 步进 “l” 停止播