​ChatTTS:Win11本地安装和一键运行包!

2024-06-05 06:52

本文主要是介绍​ChatTTS:Win11本地安装和一键运行包!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

ChatTTS 是一个专为交互式语音准备的AI语音合成项目,特点是自然,逼真,可把控声音细节,能说能笑能停顿。

效果演示

具体内容,已经在另外的文章中介绍过。

本文主要是关注两个点。

  1. 如何在Windows上安装这个项目。
  2. 分享一个已经制作好的一键运行包。

本地安装

准备工作

硬件:带英伟达显卡(显存4G+)的电脑

系统:Windows10/11

软件:git,miniconda,魔法工具

本文针对有一定基础的人,所以默认大家清楚知道上面的软硬件配置,默认大家能理解CMD命令。这些文章我就不写废话了,专注于核心内容。

如果对一些基础知识不了解的可以查看以往的基础知识类文章。

配置过程

克隆项目

git clone https://github.com/2noise/ChatTTS.git
cd ChatTTS

打开CMD,进入一个文件,执行上面的命令。

创建虚拟环境

使用miniconda创建一个Python的虚拟环境,并激活。

conda create -n chattts python=3.10
conda activate chattts

装了miniconda的话,系统中就无需单独安装Python了。只要通过命令创建一个虚拟环境即可。

安装过程比较依赖网络,需要全包网络通畅。

安装依赖

激活虚拟环境之后,就可以安装Python的依赖包了。

先安装一下torch

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

然后安装requirements文件里的依赖。

pip install -r requirements.txt

为了在本地运行.ipynb(Jupyter Notebook)文件,还需要安装一个依赖。

pip install notebook

运行Jupyter 笔记本

jupyter notebook

启动成功之后,浏览器会自动打开。

在下方的文件列表中双击打开inter.ipynb文件。

然后依次运行代码块。

运行过程中会使用本地的显卡,另外会去HF上下载模型,所以包保证硬件够用,网络通畅。

运行成功的话,会自动播放生成的语音。

输出一堆日志的问题

wavs = chat.infer(texts, use_decoder=True)

首次运行会出现很多日志,看起来像是出错了,这个不用管!等待底部进度条不动了,就证明已经运行完成。

修改语音内容

texts = ["So we found being competitive and collaborative was a huge way of staying motivated towards our goals, so one person to call when you fall off, one person who gets you back on then one person to actually do the activity with.",]*3 \        + ["我觉得像我们这些写程序的人,他,我觉得多多少少可能会对开源有一种情怀在吧我觉得开源是一个很好的形式。现在其实最先进的技术掌握在一些公司的手里的话,就他们并不会轻易的开放给所有的人用。"]*3

只要修改这里的列表内容就可以了。这里总共有六段语音,前三段是重复的英语,后三段是重复的中文。

播放语音

Audio(wavs[0], rate=24_000, autoplay=True)
Audio(wavs[3], rate=24_000, autoplay=True)

运行这两行命令,就会自动播放语音了。第一个命令播放列表里的第一段语音,第二个命令播放列表里的第四段语音。

自定义参数

params_infer_code = {'spk_emb' : rand_spk, 'temperature':.3}params_refine_text = {'prompt':'[oral_2][laugh_0][break_6]'}wav = chat.infer('四川美食可多了,有麻辣火锅、宫保鸡丁、麻婆豆腐、担担面、回锅肉、夫妻肺片等,每样都让人垂涎三尺。', params_refine_text=params_refine_text, params_infer_code=params_infer_code)wav = chat.infer('四川美食确实以辣闻名,但也有不辣的选择。比如甜水面、赖汤圆、蛋烘糕、叶儿粑等,这些小吃口味温和,甜而不腻,也很受欢迎。', params_refine_text=params_refine_text, params_infer_code=params_infer_code)

通过params_infer_code和params_refine_text可以自定义参数,这里包

括声音的设定,断句,笑声等的自动插入。

注意点

代码和依赖更新之后,可能安装过程会有差异。

torch2.0.1版本会报错,我改成了目前最新的2.3.0版本。

inter.ipynb文件已经变成了example.ipynb文件。

Windows上安装的核心配置都在上面了,下面说下一键运行包。

一键运行包

一键运行包,遵循 ALL IN PC的原则。

就是所有的东西都在一个包里,无需联网,无需单独配置,在个人电脑中,可以一键启动,快速使用。

为了让大家使用更加方便,一件包不需要运行代码块,而是会用WEBUI。

获取压缩包后,输入解压密码解压,然后双击“启动.exe”启动程序。

启动之后,跳出黑色命令窗口。

这个窗口上会显示运行日志。

当出现,Runing on local URL:xxxx之后,代表启动成功。

程序会自动调用本地默认浏览器,打开本地的指定网址。

然后按下图的步骤,点一下就可以完成AI语音生成了。

  1. 输入想要合成的文字内容
  2. 点击合成
  3. 在线试听合成效果
  4. 点击下载到本地

界面上还有一些参数,一般不用动,懂得可以根据自己需求,做适当调整。

这个UI还有很大升级空间,比如目前只有一个声音,比较合理的是,多个发音人可选。

这种就慢慢搞了,今天先这样。

收工收工,大家记得动动手指!

获取软件包

见博客文章底部:​ChatTTS:Win11本地安装和一键运行包! – 托尼不是塔克

这篇关于​ChatTTS:Win11本地安装和一键运行包!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1032366

相关文章

ESP32 esp-idf esp-adf环境安装及.a库创建与编译

简介 ESP32 功能丰富的 Wi-Fi & 蓝牙 MCU, 适用于多样的物联网应用。使用freertos操作系统。 ESP-IDF 官方物联网开发框架。 ESP-ADF 官方音频开发框架。 文档参照 https://espressif-docs.readthedocs-hosted.com/projects/esp-adf/zh-cn/latest/get-started/index

Linux 安装、配置Tomcat 的HTTPS

Linux 安装 、配置Tomcat的HTTPS 安装Tomcat 这里选择的是 tomcat 10.X ,需要Java 11及更高版本 Binary Distributions ->Core->选择 tar.gz包 下载、上传到内网服务器 /opt 目录tar -xzf 解压将解压的根目录改名为 tomat-10 并移动到 /opt 下, 形成个人习惯的路径 /opt/tomcat-10

eclipse运行springboot项目,找不到主类

解决办法尝试了很多种,下载sts压缩包行不通。最后解决办法如图: help--->Eclipse Marketplace--->Popular--->找到Spring Tools 3---->Installed。

VMware9.0详细安装

双击VMware-workstation-full-9.0.0-812388.exe文件: 直接点Next; 这里,我选择了Typical(标准安装)。 因为服务器上只要C盘,所以我选择安装在C盘下的vmware文件夹下面,然后点击Next; 这里我把√取消了,每次启动不检查更新。然后Next; 点击Next; 创建快捷方式等,点击Next; 继续Cont

vcpkg安装opencv中的特殊问题记录(无法找到opencv_corexd.dll)

我是按照网上的vcpkg安装opencv方法进行的(比如这篇:从0开始在visual studio上安装opencv(超详细,针对小白)),但是中间出现了一些别人没有遇到的问题,虽然原因没有找到,但是本人给出一些暂时的解决办法: 问题1: 我在安装库命令行使用的是 .\vcpkg.exe install opencv 我的电脑是x64,vcpkg在这条命令后默认下载的也是opencv2:x6

22.手绘Spring DI运行时序图

1.依赖注入发生的时间 当Spring loC容器完成了 Bean定义资源的定位、载入和解析注册以后,loC容器中已经管理类Bean 定义的相关数据,但是此时loC容器还没有对所管理的Bean进行依赖注入,依赖注入在以下两种情况 发生: 、用户第一次调用getBean()方法时,loC容器触发依赖注入。 、当用户在配置文件中将<bean>元素配置了 lazy-init二false属性,即让

21.手绘Spring IOC运行时序图

1.再谈IOC与 DI IOC(lnversion of Control)控制反转:所谓控制反转,就是把原先我们代码里面需要实现的对象创 建、依赖的代码,反转给容器来帮忙实现。那么必然的我们需要创建一个容器,同时需要一种描述来让 容器知道需要创建的对象与对象的关系。这个描述最具体表现就是我们所看到的配置文件。 DI(Dependency Injection)依赖注入:就是指对象是被动接受依赖类

【服务器运维】CentOS6 minimal 离线安装MySQL5.7

1.准备安装包(版本因人而异,所以下面的命令中版本省略,实际操作中用Tab自动补全就好了) cloog-ppl-0.15.7-1.2.el6.x86_64.rpmcpp-4.4.7-23.el6.x86_64.rpmgcc-4.4.7-23.el6.x86_64.rpmgcc-c++-4.4.7-23.el6.x86_64.rpmglibc-2.12-1.212.el6.x86_64.r

【服务器运维】CentOS7 minimal 离线安装 gcc perl vmware-tools

0. 本机在有网的情况下,下载CentOS镜像 https://www.centos.org/download/ 1. 取出rpm 有的情况可能不需要net-tools,但是如果出现跟ifconfig相关的错误,就把它安装上。另外如果不想升级内核版本的话,就找对应内核版本的rpm版本安装 perl-Time-Local-1.2300-2.el7.noarch.rpmperl-Tim

Windows/macOS/Linux 安装 Redis 和 Redis Desktop Manager 可视化工具

本文所有安装都在macOS High Sierra 10.13.4进行,Windows安装相对容易些,Linux安装与macOS类似,文中会做区分讲解 1. Redis安装 1.下载Redis https://redis.io/download 把下载的源码更名为redis-4.0.9-source,我喜欢跟maven、Tomcat放在一起,就放到/Users/zhan/Documents