本文主要是介绍阿里开源语音识别SenseVoiceWindows环境部署,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
SenseVoice介绍
SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测
多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。
富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。
支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。
高效推理: SenseVoice-Small 模型采用非自回归端到端框架,推理延迟极低,10s 音频推理仅耗时 70ms,15 倍优于 Whisper-Large。
微调定制: 具备便捷的微调脚本与策略,方便用户根据业务场景修复长尾样本问题。
服务部署: 具有完整的服务部署链路,支持多并发请求,支持客户端语言有,python、c++、html、java 与 c# 等。
github地址:
https://github.com/FunAudioLLM/SenseVoice/blob/main/README_zh.md
本文将使用Anaconda虚拟环境启动项目。
Anaconda介绍
conda是一个开源的包、环境管理器,可以用于在同一个机器上安装不同版本的软件包及其依赖,并能够在不同的环境之间切换。
Anaconda包括Conda、Python以及一大堆安装好的工具包,比如:numpy、pandas等。
下载地址:https://www.anaconda.com/download-success
没有注册账号的可以使用任一邮箱注册即可,流程简便不在此赘
这篇关于阿里开源语音识别SenseVoiceWindows环境部署的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!