【抢先体验】开通使用 ChatGPT 语音版功能保姆级教程

2023-10-05 19:04

本文主要是介绍【抢先体验】开通使用 ChatGPT 语音版功能保姆级教程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

image.png
大家好,我是苍何,一个土木转码的非典型程序员,也是一名技术管理者,同时也是 AI 应用的探索者。今天在视频号上看到和 ChatGPT 语音对话的视频,其声音的真实感太让人震撼了,于是也想去抢先体验一下 ChatGPT 语音版功能

网上搜索了许久,没找到相关实用教程,且很难找到语音版的入口。据 OpenAI 官方消息,在接下来的两周内,将向 Plus 和企业用户推出语音功能。那我们如何抢先体验该功能呢?

OpenAI官方对语音版的说明

本文将分享如何抢先体验 ChatGPT 语音版,并详细讲解使用指南。

一、什么是 ChatGPT 语音版

2023年9月25日 OpenAI 推出多模态功能,即 ChatGPT 将支持语音和图像。新的语音功能由新的文本到语音模型提供支持,该模型能够仅通过文本和几秒钟的示例语音生成类似人类的音频。OpenAI 与专业配音演员合作创作了每个声音。还使用开源语音识别系统 Whisper 将口语转录为文本。

**ChatGPT 语音版说白了就是能直接通过语音和 ChatGPT 进行对话,**让人震惊的是其声音的真实感和回答的逻辑性一度逼近贾维斯的感觉。

OpenAI 关于语音版公告

二、如何开通使用 ChatGPT 语音版

由于此功能现在还属于内侧阶段,仅部分用户能体验到,我这里说的是我亲测有效的方法(前提需要安卓手机)。大体流程是:安卓手机安装 Google Play,申请加入 Beta 测试,下载 ChatGPT Beta 版本,开通 plus 账号,打开语音入口。
以下是流程图。

2.1、申请加入 Beta 测试

这是最关键的一步,就是目前从应用商店下载的都是稳定版,很多未受邀请用户暂时无法体验,那我们需要申请加入 Beta 测试才可抢先体验该功能。这里以安卓的 Google Play 为例,演示如何加入 Beta 测试。

申请加入 Beta 测试

账号申请 Beta 测试需要几分钟,加入成功后我们就可以看到如上图提示,这个时候我们直接下载测试版本。一般而言,测试版本非稳定版本,但确是最新版本,也是我们抢先体验功能的基础。

2.2、开通 plus 账号

目前仅有 plus 账号才可抢先体验,所以需要开通。如何开通 plus 相信大家都已经会了,这里不赘述,但值得注意的是,由于 OpenAI 的封控策略,一定要注意尽量不要在 web 端开通以及尽量保证网络的「清洁」。

2.3、开通语音入口

打开设置
设置页面
点击 Beta Features

点击 Beta Features

开启 Voice conversations

开启 Voice conversations

注意:这里的 Browse with Bing 是 ChatGPT 的联网功能,我们以前需要通过插件联网,现在直接打开这个开关即可联网了。

点击主页图标

点击主页图标

开启语音对话

开启语音对话

查看对话历史

查看对话历史
我们每进行的一轮语音对话,均会以文本的形式进行对话展示,方便随时进行查看。

三、ChatGPT 语音版使用指南

3.1、哪些用户可以进行语音对话?

Plus 和 ChatGPT 企业计划的所有用户。其中 ChatGPT 企业计划管理员可以在管理工作区设置中为其用户切换可用性。预计一周之后会慢慢开放。

3.2、哪些应用程序可以进行语音对话?

语音对话可在适用于 iOS 和 Android 的 ChatGPT 移动应用程序上进行。

3.3、有多少个语音选项?

ChatGPT 从五种逼真的输出声音中进行选择,每种声音都有自己独特的音调和字符。可以通过 Setttings-Speech-Voice 进行声音选择。个人试验看 Breeze 对中文支持性更好。

语音设置

五种声音类型

3.4、我可以在语音对话中使用哪些模型?

GPT 3.5 和GPT 4 可用于语音对话。
请记住,对于Plus用户,GPT-4 每 3 小时有50条消息的上限。对于企业计划上的用户,没有消息上限。

3.5、我可以为语音对话设置音量限制吗?

在 ChatGPT 中,语音对话没有音量限制。音量将在设备本身上设置。

3.6、我可以在同一对话中使用ChatGPT视觉功能和语音对话吗?

可以使用视觉功能在聊天中启动语音对话,就像可以使用 GPT 3.5 或 GPT 4 在对话中启动语音对话一样。

3.7、为什么需要打开聊天记录和培训才能使用语音对话?

聊天记录和来自数据控件的培训必须切换,以便能够进行语音对话,以便可以查看对话的笔录。

主要是使用数据来提高模型性能,以何使用内容 (包括语音聊天的转录) 来改善服务和选择。

3.8、语音对话会不会保存音频

在测试版期间,来自语音对话的音频片段不会保存。ChatGPT 将音频片段发送到 Whisper API 以转录它们,但处理后不会保留它们。

要找到历史对话,可以在 ChatGPT 对话历史中找到语音对话中的文本转录。

3.9、语音对话是免提的吗?

一旦你进入语音对话,它是免提的,直到你退出语音对话。(相信以后会慢慢开放更多功能)
有手动控件,可暂停,继续和退出语音对话。

3.10、语音对话使用

开始对话:
要开始语音对话,需要点击耳机图标。建立连接后,ChatGPT 将听你讲话。
开启对话

暂停语音对话:
暂停语音对话
中断语音对话:
当ChatGPT正在说话时,您可以点击以中断:
中断

或者你可以点击停止图标:
停止图标
恢复语音对话:
点击恢复图标,然后重新开始
恢复语音对话
取消语音对话的静音:
点击取消静音。
点击取消静音
退出语音对话:
要退出语音模式,请点击 X 图标以结束语音对话,并返回到使用 ChatGPT 的基于文本的对话。
退出语音对话

3.11、可以让语音对话暂停多久?

没有限制,理论上可以无限时间暂停。

3.12、 收到 “对不起,我不能帮忙” 的回复是什么原因?

这是由于 ChatGPT 的安全措施造成的。如果提示符合,可以通过聊天中的“竖起大拇指/竖起大拇指” 选项向 ChatGPT 发送反馈。

四、总结

想象一下,当语音对话支持 API,我们可以把他集成到手机(虽然现在的 sari 也能如此,但还不够智能),放到人型机器人上,那不就是现实版的贾维斯吗?相信这一天不远了。拥抱 AI 才是普通人的破局之道。

全文完,你的点赞是对苍何创作最大鼓励\(^ ^)/


苍何个人介绍.png

创作不易,如果本文对你有帮助,欢迎点赞、收藏加关注,你的支持和鼓励,是我创作的最大动力。
文章最下方关注图片.gif

这篇关于【抢先体验】开通使用 ChatGPT 语音版功能保姆级教程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/151863

相关文章

DeepSeek模型本地部署的详细教程

《DeepSeek模型本地部署的详细教程》DeepSeek作为一款开源且性能强大的大语言模型,提供了灵活的本地部署方案,让用户能够在本地环境中高效运行模型,同时保护数据隐私,在本地成功部署DeepSe... 目录一、环境准备(一)硬件需求(二)软件依赖二、安装Ollama三、下载并部署DeepSeek模型选

Java function函数式接口的使用方法与实例

《Javafunction函数式接口的使用方法与实例》:本文主要介绍Javafunction函数式接口的使用方法与实例,函数式接口如一支未完成的诗篇,用Lambda表达式作韵脚,将代码的机械美感... 目录引言-当代码遇见诗性一、函数式接口的生物学解构1.1 函数式接口的基因密码1.2 六大核心接口的形态学

使用DeepSeek API 结合VSCode提升开发效率

《使用DeepSeekAPI结合VSCode提升开发效率》:本文主要介绍DeepSeekAPI与VisualStudioCode(VSCode)结合使用,以提升软件开发效率,具有一定的参考价值... 目录引言准备工作安装必要的 VSCode 扩展配置 DeepSeek API1. 创建 API 请求文件2.

使用TomCat,service输出台出现乱码的解决

《使用TomCat,service输出台出现乱码的解决》本文介绍了解决Tomcat服务输出台中文乱码问题的两种方法,第一种方法是修改`logging.properties`文件中的`prefix`和`... 目录使用TomCat,service输出台出现乱码问题1解决方案问题2解决方案总结使用TomCat,

解决IDEA使用springBoot创建项目,lombok标注实体类后编译无报错,但是运行时报错问题

《解决IDEA使用springBoot创建项目,lombok标注实体类后编译无报错,但是运行时报错问题》文章详细描述了在使用lombok的@Data注解标注实体类时遇到编译无误但运行时报错的问题,分析... 目录问题分析问题解决方案步骤一步骤二步骤三总结问题使用lombok注解@Data标注实体类,编译时

电脑没有仿宋GB2312字体怎么办? 仿宋GB2312字体下载安装及调出来的教程

《电脑没有仿宋GB2312字体怎么办?仿宋GB2312字体下载安装及调出来的教程》仿宋字体gb2312作为一种经典且常用的字体,广泛应用于各种场合,如何在计算机中调出仿宋字体gb2312?本文将为您... 仿宋_GB2312是公文标准字体之一,仿China编程宋是字体名称,GB2312是字php符编码标准名称(简

VScode连接远程Linux服务器环境配置图文教程

《VScode连接远程Linux服务器环境配置图文教程》:本文主要介绍如何安装和配置VSCode,包括安装步骤、环境配置(如汉化包、远程SSH连接)、语言包安装(如C/C++插件)等,文中给出了详... 目录一、安装vscode二、环境配置1.中文汉化包2.安装remote-ssh,用于远程连接2.1安装2

C语言小项目实战之通讯录功能

《C语言小项目实战之通讯录功能》:本文主要介绍如何设计和实现一个简单的通讯录管理系统,包括联系人信息的存储、增加、删除、查找、修改和排序等功能,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录功能介绍:添加联系人模块显示联系人模块删除联系人模块查找联系人模块修改联系人模块排序联系人模块源代码如下

vscode保存代码时自动eslint格式化图文教程

《vscode保存代码时自动eslint格式化图文教程》:本文主要介绍vscode保存代码时自动eslint格式化的相关资料,包括打开设置文件并复制特定内容,文中通过代码介绍的非常详细,需要的朋友... 目录1、点击设置2、选择远程--->点击右上角打开设置3、会弹出settings.json文件,将以下内

Java中使用Java Mail实现邮件服务功能示例

《Java中使用JavaMail实现邮件服务功能示例》:本文主要介绍Java中使用JavaMail实现邮件服务功能的相关资料,文章还提供了一个发送邮件的示例代码,包括创建参数类、邮件类和执行结... 目录前言一、历史背景二编程、pom依赖三、API说明(一)Session (会话)(二)Message编程客