本文主要是介绍中文语音识别实战(ASR),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
写在前面的话
本博客主要介绍了
1. 语音识别基础知识
2. 中文语音识别数据集
3. 语音识别常用模型方法
4. 自己训练一个中文语音识别模型
主意: 代码中所涉及的模型及数据集,均可从huggingface下载得到,代码中的路劲,需要根据自身实际情况稍做调整。
目录
语音识别基础
数据集
模型
wav2vec
whipser
训练代码
工具代码
推理代码
单条推理
参考
语音识别基础
音视频开发基础入门|声音的采集与量化、音频数字信号质量、音频码率_量化后的声音信号-CSDN博客
https://huggingface.co/learn/audio-course/chapter1/audio_data
数据集
包含大陆,香港,台湾等地的语音数据。
https://huggingface.co/datasets/fsicoli/common_voice_17_0
模型
wav2vec
https://huggingface.co/facebook/wav2vec2-base
这篇关于中文语音识别实战(ASR)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!