GPT-SoVITs从零开始训练声音克隆教程(以云端AutoDL部署为例)【教程超详细】

本文主要是介绍GPT-SoVITs从零开始训练声音克隆教程(以云端AutoDL部署为例)【教程超详细】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

打开网站
https://www.autodl.com/
注册账户和和实名认证、绑定微信才能使用。操作完成后选择镜像购买。
在这里插入图片描述
等待创建完成
在这里插入图片描述
创建完成单击JupyterLab
在这里插入图片描述
在文件GPT-Sovits(使用).ipynb拉到最下面
先运行下图框中命令
在这里插入图片描述
再运行下图框中命令,然后单击蓝色链接
在这里插入图片描述
打开页面如下所示
在这里插入图片描述
单击是否开启UVR5-WebUl
在这里插入图片描述

打开UVR5-WebUl页面
在这里插入图片描述
打开页面如下所示
在这里插入图片描述
在这里插入图片描述
UVR5-WebUl页面上传处理的声音文件
在这里插入图片描述
上传完声音点击转换
在这里插入图片描述
转换日志
在这里插入图片描述
转换完成提示
在这里插入图片描述
转换完成文件
在这里插入图片描述
把刚才转换后成功的文件上传到这个文件路径下
在这里插入图片描述
开启语音切割(填写对应的输入地址,输出等信息)
在这里插入图片描述
切割完的文件如下所示
在这里插入图片描述
开启离线批量ASR(注意路径)
在这里插入图片描述
处理日志
在这里插入图片描述
处理完成后的文件
在这里插入图片描述
开启打标WebUI
在这里插入图片描述
点击日志地址
在这里插入图片描述
核对每个声音都正确后保存,下一页核对再保存,处理完后就可以关闭了。
在这里插入图片描述
打开TTS页面
设置模型名称,选择刚才生产的list文件夹,及其音频

在这里插入图片描述
开启文本获取,等待完成
在这里插入图片描述
开启SSL提取,等待完成
在这里插入图片描述
开启Token提取,等待完成
在这里插入图片描述
一键三连,等待完成
在这里插入图片描述
开始训练
在这里插入图片描述
在这里插入图片描述
训练完成
在这里插入图片描述
刷新训练结果
在这里插入图片描述
选择刚才训练的数据
在这里插入图片描述
选择刚才训练的数据
在这里插入图片描述
开启UI
在这里插入图片描述
点击日志开启UI
在这里插入图片描述
上传对比音频
在这里插入图片描述
可以上传刚才切割出来的文件
在这里插入图片描述
输入音频对应的文字
在这里插入图片描述
输入我们想要转换的语音,点击合成语音,就可以听到想模拟的声音了,可以下载哦。
在这里插入图片描述
切换日语模式,日语模式也能合成,是不是第一次听自己说日语。
在这里插入图片描述

这篇关于GPT-SoVITs从零开始训练声音克隆教程(以云端AutoDL部署为例)【教程超详细】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/684741

相关文章

闲置电脑也能活出第二春?鲁大师AiNAS让你动动手指就能轻松部署

对于大多数人而言,在这个“数据爆炸”的时代或多或少都遇到过存储告急的情况,这使得“存储焦虑”不再是个别现象,而将会是随着软件的不断臃肿而越来越普遍的情况。从不少手机厂商都开始将存储上限提升至1TB可以见得,我们似乎正处在互联网信息飞速增长的阶段,对于存储的需求也将会不断扩大。对于苹果用户而言,这一问题愈发严峻,毕竟512GB和1TB版本的iPhone可不是人人都消费得起的,因此成熟的外置存储方案开

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

4B参数秒杀GPT-3.5:MiniCPM 3.0惊艳登场!

​ 面壁智能 在 AI 的世界里,总有那么几个时刻让人惊叹不已。面壁智能推出的 MiniCPM 3.0,这个仅有4B参数的"小钢炮",正在以惊人的实力挑战着 GPT-3.5 这个曾经的AI巨人。 MiniCPM 3.0 MiniCPM 3.0 MiniCPM 3.0 目前的主要功能有: 长上下文功能:原生支持 32k 上下文长度,性能完美。我们引入了

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

沁恒CH32在MounRiver Studio上环境配置以及使用详细教程

目录 1.  RISC-V简介 2.  CPU架构现状 3.  MounRiver Studio软件下载 4.  MounRiver Studio软件安装 5.  MounRiver Studio软件介绍 6.  创建工程 7.  编译代码 1.  RISC-V简介         RISC就是精简指令集计算机(Reduced Instruction SetCom

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX

arduino ide安装详细步骤

​ 大家好,我是程序员小羊! 前言: Arduino IDE 是一个专为编程 Arduino 微控制器设计的集成开发环境,使用起来非常方便。下面将介绍如何在不同平台上安装 Arduino IDE 的详细步骤,包括 Windows、Mac 和 Linux 系统。 一、在 Windows 上安装 Arduino IDE 1. 下载 Arduino IDE 打开 Arduino 官网

在 Windows 上部署 gitblit

在 Windows 上部署 gitblit 在 Windows 上部署 gitblit 缘起gitblit 是什么安装JDK部署 gitblit 下载 gitblit 并解压配置登录注册为 windows 服务 修改 installService.cmd 文件运行 installService.cmd运行 gitblitw.exe查看 services.msc 缘起