文本生成超逼真语音,ElevenLabs获8000万美元融资

2024-01-23 16:44

本文主要是介绍文本生成超逼真语音,ElevenLabs获8000万美元融资,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1月23日,文本生成语音平台ElevenLabs在官网宣布,获得8000万美元(约5.7亿元)B轮融资。本次由Andreessen


Horowitz、 Nat Friedman领投,红杉资本、 SV Angel等跟投。

用户通过文本和语音的方式在ElevenLabs平台,就能生成中文、英文、日文、韩文等29种语言以及1000多种声音,同时可以对生成语音的清晰度、风格、稳定等参数进行自定义设置。

此外,ElevenLabs在宣布融资的同时发布了新的配音工作室、语音库和移动应用三款预览产品,以巩固其在生成式AI语音领域的独角兽地位。

图片

资料显示,ElevenLabs创立于2022年4月,总部位于美国纽约,最初员工不超过10人,目前已增长至40多人。

ElevenLabs曾在2023年1月获得200万美元种子轮融资,6月21日获得1900万美元A轮融资。

ElevenLabs于2023年1月正式推出了测试产品,因简单、易用、免费等优势,其注册用户很快突破100万,目前41%的财富 500 强公司在使用其产品

包括世界上最大的有声读物出版商之一的Storytel;全球著名内容创作者平台TheSoul Publishing;

知名游戏开发商Paradox Interactive等。这些企业通过ElevenLabs平台制作有声读物、电影配音、游戏NPC的声音等。

图片


Eleven Labs核心团队

产品方面,ElevenLabs基于自研的Eleven Multilingual v2、Turbo v2等大模型,提供文本生成语音、语音生成语音、语音克隆、语音识别等特色功能。

文本生成语音:用户通过文本可直接生成中文、英文、韩文、日文等29种语言语音,同时支持跨文本语音生成。例如,上传了一段英语文本,可直接生成意大利语音。

使用方法也非常简单,先选择语音生成的类型,然后选择应用的模型、语音参数和模仿语音,再输入文本,通常几秒钟就能生成语音。

图片

虽然ElevenLabs支持中文语音,但根据「AIGC开放社区」的实际体验,其语音、语调等方面还是有很强的机器人感觉,英语和其他语种表现却很好。

语音转语音:可帮助用户将语音自动转换成别的语音,例如,上传了一段男声语音,可以自动转换成老年人的声音。

传统的语音转换方法是,需要采集音频样本,然后提取基频、共振峰、时域和频域特征等,再进行去噪、归一化,整个流程非常繁琐复杂。

而ElevenLabs可实现一键语音转换,同时支持用户对语音进行可视化控制,例如,修改强度、音峰、情感等参数。

图片

语音克隆:用户提供一段语音片段,将其上传到ElevenLabs平台。就能通过新上传的语音,创建全新的内容,整体模仿效果非常出色。

为了减少ElevenLabs平台生成一些非法语音,例如,模仿他人亲戚用于电信诈骗,ElevenLabs推出了语音识别分类功能,用户只需要上传语音便能快速识别出是真人发音或AI自动生成的,这对于提升产品的安全性非常重要。

图片

此外,为了进一步提升语音方面的功能,ElevenLabs在今天宣布推出了新的配音工作室、语音库和移动应用三款全新的预览产品。

新的配音工作室:可帮助用户为整部电影配音,并生成和编辑其转录、翻译和时间码,从而为内容制作提供更多控制。该功能主要面向长视频和影业的用户。

语音库:用户可以将自建的语音模板在语音库进行分享,当有其他用户使用时可以获得报酬。这个功能与OpenAI的自定义ChatGPT商店类似,都是鼓励开发者共同创建产品生态。

图片

移动应用:可以让用户通过移动应用中,使用ElevenLabs的产品功能。前三个月将免费为用户提供服务,目前处于申请预览版状态。

ElevenLabs首席技术官 Piotr Dąbkowski表示,通过此次 B 轮融资,ElevenLabs将巩固其在生成式AI语音领域的领导者地位。

这笔资金将用于产品研究、扩大基础设施、为特定垂直领域开发新产品,以及加强安全措施,确保以负责任和合乎道德的方式开发生成式AI技术。

本文素材来源ElevenLabs官网,如有侵权请联系删除

END

这篇关于文本生成超逼真语音,ElevenLabs获8000万美元融资的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/636880

相关文章

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

poj 1258 Agri-Net(最小生成树模板代码)

感觉用这题来当模板更适合。 题意就是给你邻接矩阵求最小生成树啦。~ prim代码:效率很高。172k...0ms。 #include<stdio.h>#include<algorithm>using namespace std;const int MaxN = 101;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int n

poj 1287 Networking(prim or kruscal最小生成树)

题意给你点与点间距离,求最小生成树。 注意点是,两点之间可能有不同的路,输入的时候选择最小的,和之前有道最短路WA的题目类似。 prim代码: #include<stdio.h>const int MaxN = 51;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int P;int prim(){bool vis[MaxN];

poj 2349 Arctic Network uva 10369(prim or kruscal最小生成树)

题目很麻烦,因为不熟悉最小生成树的算法调试了好久。 感觉网上的题目解释都没说得很清楚,不适合新手。自己写一个。 题意:给你点的坐标,然后两点间可以有两种方式来通信:第一种是卫星通信,第二种是无线电通信。 卫星通信:任何两个有卫星频道的点间都可以直接建立连接,与点间的距离无关; 无线电通信:两个点之间的距离不能超过D,无线电收发器的功率越大,D越大,越昂贵。 计算无线电收发器D

hdu 1102 uva 10397(最小生成树prim)

hdu 1102: 题意: 给一个邻接矩阵,给一些村庄间已经修的路,问最小生成树。 解析: 把已经修的路的权值改为0,套个prim()。 注意prim 最外层循坏为n-1。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstri

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

poj 3723 kruscal,反边取最大生成树。

题意: 需要征募女兵N人,男兵M人。 每征募一个人需要花费10000美元,但是如果已经招募的人中有一些关系亲密的人,那么可以少花一些钱。 给出若干的男女之间的1~9999之间的亲密关系度,征募某个人的费用是10000 - (已经征募的人中和自己的亲密度的最大值)。 要求通过适当的招募顺序使得征募所有人的费用最小。 解析: 先设想无向图,在征募某个人a时,如果使用了a和b之间的关系