首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
paddlespeech专题
PaddleSpeech MFA:阿米娅中文音色复刻计划
PaddleSpeech:阿米娅中文音色复刻计划 本篇项目是对iterhui大佬项目[PaddleSpeech 原神] 音色克隆之胡桃的复刻,使用的PaddleSpeech的版本较新,也针对新版本的PaddleSpeech做了许多配置之上的更新并加入了自己对语音的对齐、配置、训练其它任何语音音色的模块。 本篇项目旨在利用PaddleSpeech框架实现音色克隆技术,目标是复制并生成游戏《明
阅读更多...
语音识别-paddlespeech-流程梳理
上一次研究语音识别是21年年底的事情了,记得当时是先进行了语音识别的应用,然后操作了模型的再次训练;两年过去,关于ASR相关流程忘得差不多了,这次基于paddlespeech的代码,进行了流程的梳理,关于一些细节还在学习中,先记录于此: 'zh:[conformer_wenetspeech-zh-16k], ''en:[transformer_librispeech-en-16k], ''z
阅读更多...
Docker 之 PaddleSpeech 有手就会保姆式安装教程
docker hub资料:https://hub.docker.com/r/paddlecloud/paddlespeech/tags docker资料: https://www.bookstack.cn/read/paddlepaddle-2.1-zh/d9c666aec965a43c.md install setup: 1=》[#]docker pull paddlecloud/paddle
阅读更多...
【超简单】基于PaddleSpeech搭建个人语音听写服务
一、【超简单】之基于PaddleSpeech搭建个人语音听写服务 1.需求分析 亲们,你们要写会议纪要嘛?亲们,你们要写会议纪要嘛?亲们,你们要写会议纪要嘛? 当您面对成吨的会议录音,着急写会议纪要而不得不愚公移山、人海战术?听的头晕眼花,听的漏洞百出,听的怀疑人生,那么你是否想到了自动听写服务? 想想也是,百度一看,好家伙,收费不菲啊!请看下图 2.
阅读更多...
orin nx 安装paddlespeech记录
nx配置: 模块 版本说明 CPU 8核 内存 16G Cuda版本 11.4 Opencv版本 4.5.4 Tensorrt版本 5.1 Cudnn版本 8.6.0.166 Deepstream版本 6.2 Python版本 3.8 算力 100T 安装paddlepaddle: 去飞桨官网下载jetpack版本的:下载安装 Linux
阅读更多...
飞桨paddlespeech语音唤醒推理C INT8 定点实现
前面的文章(飞桨paddlespeech语音唤醒推理C定点实现)讲了INT16的定点实现。因为目前商用的语音唤醒方案推理几乎都是INT8的定点实现,于是我又做了INT8的定点实现。 实现前做了一番调研。量化主要包括权重值量化和激活值量化。权重值由于较小且均匀,还是用最大值非饱和量化。最大值法已不适合8比特激活值量化,用的话误差会很大,识别率等指标会大幅度的降低。激活值量化好多方案用的是NVI
阅读更多...
分享本周所学——Linux(Ubuntu)CUDA环境搭建以及借助PaddleSpeech实现实时录音的流式语音识别
大家好,欢迎来到《分享本周所学》第三期。本人是一名人工智能初学者,最近一周给自己的Linux虚拟机配置了GPU环境,然后还借助PaddleSpeech里面一个流式语音识别的demo实现了实时录音的流式语音识别,学到了非常多的知识,就想把学到的东西分享给大家,不管你是想跟着我从头到尾做一个流式语音识别,还是只想借鉴一下我其中某个环节是怎么做的,相信你都可以有所收获。这周我也遇到了很多
阅读更多...
人工智能-语音识别技术paddlespeech的搭建和使用
PaddleSpeech 介绍 PaddleSpeech是百度飞桨(PaddlePaddle)开源深度学习平台的其中一个项目,它基于飞桨的语音方向模型库,用于语音和音频中的各种关键任务的开发,包含大量基于深度学习前沿和有影响力的模型。PaddleSpeech支持语音识别、语音翻译(英译中)、语音合成、标点恢复等应用示例。 安装paddlespeech PaddleSpeech 快速安装方式有
阅读更多...
【PaddleSpeech进阶】语音合成-onnx模型使用
很多同学对PaddleSpeech发布的语音合成onnx模型的使用比较感兴趣,这篇教程将教会你如何使用PaddleSpeech提供的语音合成预训练模型完成推理工作。 0. PaddleSpeech 介绍 🚀 PaddleSpeech 是 all-in-one 的语音算法工具箱,包含多种领先国际水平的语音算法与预训练模型。你可以从中选择各种语音处理工具以及预训练模型,支持语音识别,语音合成,声
阅读更多...