AIGC基于文本生成音乐,现在压力来到配乐行业这边|Github

2024-02-15 00:20

本文主要是介绍AIGC基于文本生成音乐,现在压力来到配乐行业这边|Github,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

宇航员骑马奔驰,配什么BGM比较飒?这活交给AI试试!

输入文本“宇航员骑大马”,秒速生成一段1分钟的音频:

emmm……听起来好动感!

b4713fb139cd6f4abf8590cd34a1be5a.png

是的没错,AI可以基于文字提示生成音乐

上面这段演示视频,基于Deforum Stable Diffusion的Colab页面代码修改而来。

这只新项目的名字叫Mubert API,已在Github开源,获得1000多的标星。

推特上也有不少人已经用Mubert API生成音频,来给自己的视频配乐了。

试听过的友友们这样留言:

89526068896738845f1a88bc76cc55d5.png

音乐由真人谱曲、AI组曲

在演示视频里面,这个text-to-music的AI,实际生成效果听起来还不错。

那不如来看看,Mubert API是怎么工作的吧。

大概的工作流程是这样的:

音乐人谱曲后上传→AI进行风格分类→用户输入文本→AI用demo组曲→生成个性化音乐

也就是说,虽然Mubert API在进行text-to-music的工作,但是AI负责的部分,只有两个步骤:

分类demo + 根据提示文本组合demo成曲。

简而言之,最后生成的音乐,是由真人谱曲、AI组曲

具体是怎么回事呢?

回到第一个步骤,音乐人们制作好demo,上传到Mubert。

采用这种方法,而非AI学习音乐人样本后自己生成新的音乐,是因为Mubert有“从创造者到创造者”的理念。

目前,音乐人们上传的超过150万个demo进入Mubert API的音乐库。

为了让用户们玩得开心,Mubert买下了所有demo的版权。

在线玩耍后生成的音乐,可以免费用来配图或配视频画面。

要在各个社交平台分享的话,务必@mubertapp并带上#mubert话题。

但是,绝对不可以在DSP(Spotify,Apple Music,Deezer等)上面标为原创发表。

至于商用,得是另外的价钱。

14c7080263130b7c99a74c908cbdc6cf.png

Demo上传、入库以后,AI识别音乐风格,将它们分组归类,以便于打标签。

前期工作准备就绪,现在来说说具体操作流程

用户需要输入一句话作为提示文本,再加几个Mubert API标签。

注意,生成音乐的时长可以调节,要不要进行循环、选取哪一段开始循环,也都可以凭你喜欢。

50ffa609c5463817268bb2b0183b7c23.png

比如宇航员骑大马,配的标签就是“空间”“萨克斯”“旅行”。

这些文本内容会被编码到Transformer的潜在空间向量中,然后,AI会选择那些和提示词及标签最接近的标记向量。

也就是说,AI经过分析后,会选择符合提示文本的音乐demo,把它们排列组合。

如此这般,根据文本生成的个性化音乐,出现了!

值得一提的是,即便输入相同的提示文本,生成雷同音乐的可能性也比较小。

因为所有的音乐,是在提交请求的时候即时生成的,而不是从已有的曲目库中直接拿来用。

7079f02867de993a31d422c6fc1b28ee.jpeg

一经开源,网友们已经玩儿开了。

日本网友用来生成和风流行音乐(但他也很疑惑,和印象里的日本音乐不咋一样哈)。

当然,也有人尝试了用Mubert API给即将到来的万圣节增加一点恐怖气氛。

也有玩家试玩过后表示,Mubert API在进行音乐生成时,提示文本和标签只能提供一种音乐的氛围,而不能直接搞搞节奏什么的。

092340cf2da2dd9959e1448eedc9f61c.png

Mubert系列

浅看了一下官网,除了Mubert API,Mubert系列还有另外几个项目。

根据既有标签生成音乐的Mubert Render

和API相比,它棋差一招,没办法让用户手动输入提示文本。

但玩儿的人不少,页面上还有很多已生成音乐在推荐位上。

fd3259f83d2b90ea04fe0fa116dece95.png

以及,专供音乐人们上传自己音乐demo,赚点小钱钱的Mubert Studio

(你说说,和API形成闭环了不是)

也不复杂,简简单单一注册就可。

9bb2afe7902cdce678af407c1c6b8dd9.png

还有个叫Mubert Play的App。

你在做运动、放松或者冥想的时候,需要的听歌软件又添一员。

4c29c079872c023b6b4702aa0799f4c2.png

有那么一点小遗憾,除了自行运行开源代码,现在普通玩家还不能玩上网页版。

好在创作团队在Twitter上放话:

Mubert API很快就能够在官网上线!会尽快开发一个简单易用、用户友好的Web界面。

再等等吧!

Github地址:
https://github.com/MubertAI/Mubert-Text-to-Music

Mubert官网:
https://mubert.com/

这篇关于AIGC基于文本生成音乐,现在压力来到配乐行业这边|Github的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/709977

相关文章

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

poj 1258 Agri-Net(最小生成树模板代码)

感觉用这题来当模板更适合。 题意就是给你邻接矩阵求最小生成树啦。~ prim代码:效率很高。172k...0ms。 #include<stdio.h>#include<algorithm>using namespace std;const int MaxN = 101;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int n

poj 1287 Networking(prim or kruscal最小生成树)

题意给你点与点间距离,求最小生成树。 注意点是,两点之间可能有不同的路,输入的时候选择最小的,和之前有道最短路WA的题目类似。 prim代码: #include<stdio.h>const int MaxN = 51;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int P;int prim(){bool vis[MaxN];

poj 2349 Arctic Network uva 10369(prim or kruscal最小生成树)

题目很麻烦,因为不熟悉最小生成树的算法调试了好久。 感觉网上的题目解释都没说得很清楚,不适合新手。自己写一个。 题意:给你点的坐标,然后两点间可以有两种方式来通信:第一种是卫星通信,第二种是无线电通信。 卫星通信:任何两个有卫星频道的点间都可以直接建立连接,与点间的距离无关; 无线电通信:两个点之间的距离不能超过D,无线电收发器的功率越大,D越大,越昂贵。 计算无线电收发器D

hdu 1102 uva 10397(最小生成树prim)

hdu 1102: 题意: 给一个邻接矩阵,给一些村庄间已经修的路,问最小生成树。 解析: 把已经修的路的权值改为0,套个prim()。 注意prim 最外层循坏为n-1。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstri

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

poj 3723 kruscal,反边取最大生成树。

题意: 需要征募女兵N人,男兵M人。 每征募一个人需要花费10000美元,但是如果已经招募的人中有一些关系亲密的人,那么可以少花一些钱。 给出若干的男女之间的1~9999之间的亲密关系度,征募某个人的费用是10000 - (已经征募的人中和自己的亲密度的最大值)。 要求通过适当的招募顺序使得征募所有人的费用最小。 解析: 先设想无向图,在征募某个人a时,如果使用了a和b之间的关系

Thymeleaf:生成静态文件及异常处理java.lang.NoClassDefFoundError: ognl/PropertyAccessor

我们需要引入包: <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-thymeleaf</artifactId></dependency><dependency><groupId>org.springframework</groupId><artifactId>sp