顶顶通热词模型配置热词方法(mod

本文主要是介绍顶顶通热词模型配置热词方法(mod_cti基于FreeSWITCH)，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

文章目录

前言
热词文件
模型下载
- 实时热词模型（对接mod_cti）
- 一句话热词模型（对接mod_vad）

前言

在语音转文字时，如果在您的业务领域有一些特有的词，默认识别效果较差的时候可以考虑使用热词模型功能，把这些词添加到一个热词文件中，可以改善这些词的识别结果。这种方式配置后，就可以生效。

也可以处理同音词，例如：王小明和王晓铭，通常普通模型会识别成 “王小明”，如果把 “王晓铭” 这个名字添加到热词文件中，就可以优先识别成 “王晓铭”。

但热词模型也有缺点：相较于普通模型，热词模型识别更消耗CUP。

热词文件

在想要使用私有化热词模型之前，需要创建一个热词文件，类型：.txt。例如：hotword.txt。
热词存放要求：
- 一行一个热词
- 热词尽量简短，不要过长。

例如：

福州
物流
包邮

上传至服务器中，可任意路径。推荐：上传至asrproxy程序目录中。

模型下载

实时热词模型（对接mod_cti）

SSH终端执行命令下载模型：

curl -s http://down.ddrj.com/getasrmodel.sh | bash -s paraformer-large-contextual paraformer-large-online

配置asrproxy.json：将以下配置添加到asrproxy.json文件中的对应位置，需要配置哪些会以文字形式描述。

    "asr":{"listen_ip":"127.0.0.1", "listen_port":9988,"storage":"record", "acl":"*", "interface": {//实时热词模型的配置，从这里开始复制。"paraformer_contextual_16K": { "type": "funasr", "engine": "2pass", "quantize": true, "enable_itn": true, "itn-dir": "/ddt/asrproxy/funasr/fst_itn_zh", "vad-dir": "/ddt/asrproxy/funasr/speech_fsmn_vad_zh-cn-16k-common-onnx", "vad-quant": true, "punc-dir": "/ddt/asrproxy/funasr/punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727-onnx", "model-dir": "/ddt/asrproxy/funasr/speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404-onnx", "online-model-dir": "/ddt/asrproxy/funasr/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online-onnx", "lm-dir": "/ddt/asrproxy/funasr/speech_ngram_lm_zh-cn-ai-wesp-fst", "hotword": "",       //配置热词文件的地方，使用绝对路径。例如：hotword.txt热词文件上传在服务器的/ddt/asrproxy目录中，那么这里应该配置：/ddt/asrproxy/hotword.txt"chunk-size": 800}//复制到这里结束。然后把复制的这一段配置放在asrproxy.json文件的对应位置。},"groups":{"default":{ "mode":0, "enable": ["paraformer_contextual_16K"   //asrproxy.json文件的对应位置配置：paraformer_contextual_16K]}}

一句话热词模型（对接mod_vad）

SSH终端执行命令下载模型：

curl -s http://down.ddrj.com/getasrmodel.sh | bash -s paraformer-large-contextual

配置asrproxy.json：将以下配置添加到asrproxy.json文件中的对应位置，需要配置哪些会以文字形式描述。

    "short_sentence_asr":{"listen_ip":"0.0.0.0", "listen_port":9990,"bgasr_thread_count":null, "users":{"test":{          "not_validate_signature":false,"key":"test","ip":"*"}}},//上面的这一段也需要复制到asrproxy.json文件中的对应位置。"asr":{"listen_ip":"127.0.0.1","listen_port":9988,"storage":"record","acl":"*", "interface": {//一句话热词模型配置，从这里开始复制。"contextual_16K": { "type": "funasr", "engine": "sentence", "quantize": true, "enable_itn": true, "itn-dir": "/ddt/asrproxy/funasr/fst_itn_zh", "vad-dir": "/ddt/asrproxy/funasr/speech_fsmn_vad_zh-cn-16k-common-onnx", "vad-quant": true, "punc-dir": "/ddt/asrproxy/funasr/punc_ct-transformer_zh-cn-common-vocab272727-onnx", "model-dir": "/ddt/asrproxy/funasr/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-onnx", "online-model-dir": "", "lm-dir": "/ddt/asrproxy/funasr/speech_ngram_lm_zh-cn-ai-wesp-fst", "hotword": ""    //配置热词文件的地方，使用绝对路径。例如：hotword.txt热词文件上传在服务器的/ddt/asrproxy目录中，那么这里应该配置：/ddt/asrproxy/hotword.txt}//复制到这里结束。然后把复制的这一段配置放在asrproxy.json文件的对应位置。},"groups":{//从这里开始复制。"shortsentence":{"mode":0,"enable":["contextual_16K" ]}//复制到这里结束，然后把复制的这一段放在asrproxy.json配置文件中的asr.groups中。   }}

这篇关于顶顶通热词模型配置热词方法(mod_cti基于FreeSWITCH)的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

顶顶通热词模型配置热词方法(mod_cti基于FreeSWITCH)

文章目录

前言

热词文件

模型下载

实时热词模型（对接mod_cti）

一句话热词模型（对接mod_vad）

相关文章

Nginx 访问控制的多种方法

springboot3.x使用@NacosValue无法获取配置信息的解决过程

Python中Request的安装以及简单的使用方法图文教程

nginx跨域访问配置的几种方法实现

MySQL查看表的历史SQL的几种实现方法

MySQL底层文件的查看和修改方法

Java实现字符串大小写转换的常用方法

使用Python实现局域网远程监控电脑屏幕的方法

检查 Nginx 是否启动的几种方法

Java方法重载与重写之同名方法的双面魔法(最新整理)