读天才与算法:人脑与AI的数学思维笔记17_歌曲的创作公式

2024-05-04 08:44

本文主要是介绍读天才与算法:人脑与AI的数学思维笔记17_歌曲的创作公式,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. 人为何创作音乐

1.1. 音乐一直具有算法性质,这意味着在所有的艺术形式中,它受到人工智能进步的威胁最大

1.1.1. 音乐也是所有艺术形式中最抽象的一种,它利用结构和模式,而正是这种抽象的性质使它与数学紧密相连

1.1.2. 在这个世界里,算法将像人类一样得心应手

1.2. 音乐不仅仅是结构和模式而已,必须通过表演来赋予其生气

1.3. 对宗教仪式的需求是人类代码的一部分

1.3.1. 宗教仪式由一系列的活动组成,包括手势、言语和物品摆放,这些活动在一个神圣的地方按照固定的顺序或模式进行

1.3.2. 从外部来看,仪式似乎是非理性或不合逻辑的

1.3.3. 对内部来说,它提供了一种联系团队的重要方式

1.3.4. 随着文明的发展,音乐继续是仪式世界中的一部分

1.3.4.1. 从帕勒斯特里纳到巴赫再到莫扎特,音乐的巨大进步往往是在宗教背景下取得的

1.3.5. 随着我们内在意识的觉醒,“上帝”的概念将出现在人类身上

1.3.5.1. 随着意识的发展,意识到自己头脑中有一个声音,此时你会感到震惊

1.3.6. 宗教仪式和音乐可以安抚大脑中的声音,而自然的力量似乎是众神所为

1.4. 音乐是人与人之间交流的社会行为,是友谊的象征,是强大无敌的

1.4.1. 在德国发现的4万年前旧石器时代的笛子表明,我们的祖先可能能够进行远距离的交流

1.5. 在创造改变思维的仪式时,音乐是一个强有力的因素

1.5.1. 不断重复可以帮助改变我们的意识状态,正如许多萨满教仪式所证实的一样

1.5.2. 我们的大脑具有与不同的心理状态相对应的固有频率

1.5.2.1. 恍惚音乐充分利用了这个事实,即每分钟120拍的音乐最适合诱导人类产生幻觉体验
1.5.2.2. 混淆多种感官输入会导致大脑产生奇怪的灵魂出窍的体验
1.5.2.3. 触觉和视觉的组合可能使人产生肢体识别的障碍或假象
1.5.2.4. 我们经常能在发现早期的乐器时一同发现香料或草药,因为它们的组合既能给仪式带来一种气味(嗅觉),也能给仪式带来一种声音(听觉)

1.6. “吼板”

1.6.1. 吼板是一种自旧石器时代流传至今的古老发声器,在世界许多文化中都能找到其踪迹

1.6.2. 一臂长的坚硬木板被固定在一根长绳的末端,只要持有者将它甩过头顶并不断旋转,它就会发出一种360度环绕音响效果的轰鸣声,这会给持有者带来迷幻感,而声音可传至很远的地方

1.7. 算法已经学会了生成让我们感动的声音

1.7.1. Algoraves现在使用的算法可以对跳动的人群做出反应,帮助DJ策划舞曲和打碟

1.7.2. “深度巴赫”正在为教堂唱诗班创作更多的宗教合唱来歌颂上帝

1.7.3. 尽管这些算法似乎已经破解了音乐的代码,但是机器内部仍然是毫无波澜的

1.7.4. 这一切就像现代的数字“吼板”,它们仍然只是我们的工具而已

2. 创作公式

2.1. 音乐能言不能言,亦能言,不得不言

2.1.1. 维克多·雨果(Victor Hugo

2.2. 一首爵士乐会有一组标准的和弦,这些和弦会随着乐曲的演奏出现并变化

2.3. 小号手的任务是在变换和弦时吹奏一条与和弦相吻合的旋律线条

2.3.1. 他吹奏的旋律必然是一个音符到另一个音符,同时还要保证能组成旋律,所以演奏爵士乐就像在二维迷宫中描绘一条线一样

2.3.2. 和弦决定了垂直方向的动态,而他刚刚演奏的旋律决定了水平的动态

2.3.3. 随着爵士乐即兴成分的增加,音乐变得更自由,同时和声的发展也会变得更加流动,这就要求小号手必须能敏锐地觉察并预判钢琴手的发展意图,其发展的方向是由前面和声的发展决定的

2.4. 判断即兴演奏者水平的标准是,他是否会倾听并预判出主奏乐器的发展意图且配合得天衣无缝

2.5. 即兴爵士乐算法必须在实时交互中同时完成播放与对新材料的处理和响应

3. 爵士乐宝典

3.1. The Jazz Theory Book

3.2. 马克·列文(Mark Levine)所著的《爵士乐宝典》(The Jazz Theory Book)是许多青年音乐家初学时的经典用书

3.3. 列文经常和20世纪最伟大的即兴爵士乐演奏家迪兹·吉莱斯皮(Dizzy Gillespie)、弗雷迪·哈伯德(Freddie Hubbard)一起演奏

3.4. 一首伟大的爵士独奏是由1%的魔力和99%的可解释、可分析、可分类、可操作的东西组成的。

3.4.1. 马克·列文(Mark Levine)

3.4.2. 99%都是可以放进算法里的

4. 马尔可夫链

4.1. 在许多的算法中都可以看到马尔可夫链在起着重要的作用

4.1.1. 从模拟化学反应、经济趋势,到互联网导航,再到评估生物种群、人口动态

4.1.2. 俄国数学家安德烈·马尔可夫(Andrey Markov)选择检验自己理论的,不是科学,而是普希金的诗

4.2. 帕维尔·涅克拉索夫

4.2.1. 和马尔可夫的观点恰恰相反

4.2.2. 现实世界中的事物是相互依存的(比如人的行为),所以现实中的事物并不恰好符合数学模式或分布

4.2.3. 俄国的犯罪率统计是遵循大数定律的,但事实上,罪犯决定犯罪都是由个人意志决定的

4.3. 概率论的核心之一是“大数定律”

4.3.1. 概率论史上第一个极限定理属于伯努利

4.3.2. 这是概率论中讨论随机变量序列的算术平均值向随机变量各数学期望的算术平均值收敛的定律

4.3.2.1. 在随机事件的大量重复出现中,往往呈现几乎必然的规律

4.3.3. 如果你有一枚硬币,而每抛一次硬币都完全独立于上一次抛硬币,那么当你多次抛硬币时,正面和反面出现的次数之比就会越来越接近于一半对一半的比例

4.3.3.1. 抛掷硬币4次,全是正面的概率是1/16,但随着抛硬币次数的增加,偏离对半分概率的可能就会降低

4.3.4. 马尔可夫需要建立一个模型,在这个模型中,结果的概率取决于以前发生的事件,但长期来看仍然遵循大数定

4.3.4.1. 抛硬币的结果并不取决于以前抛硬币的结果,所以这不是马尔可夫理想的模型

4.4. 每个事件的概率仅取决于先前事件的一系列事件被称为马尔可夫链

4.4.1. 预测天气就是一个例子:明天的天气肯定取决于今天的天气,但并不特别依赖于上周的天气

4.4.1.1. 明天的天气只取决于今天的天气

4.4.2. 尽管每天的天气都依赖于前一天的天气,但从长远来看,无论我们的模型是从晴天、雨天还是阴天出发,下雨的概率都会趋向于相同的数值(32.35%)

4.4.3. 即使明天的天气依赖于今天的天气,长期的天气预报也与今天的天气无关

4.4.3.1. 通过数据我们可知,今天的天气是什么并不重要(即我们选择哪一行来观察),第十天的概率总是相同的

4.4.4. 从长期犯罪统计数据来看,罪犯决意犯罪是由个人自由意志决定的,这个论点是站不住脚的

4.5. 普希金(Pushkin)的《尤金·奥涅金》(Eugene Onegin)

4.5.1. 用它作为一个数据集来分析元音和辅音的出现概率

4.5.2. 马尔可夫提取了这首诗的前20 000个字母(大约占整首诗的1/8),计算了元音和辅音出现的次数

4.5.3. 一个辅音后面会跟着另一个辅音的概率是34%,而辅音后面会跟着一个元音的概率是66%

4.5.4. 尽管前几个字母在很大程度上取决于起始字母的选择,但是马尔可夫证明,从长远来看,字母的分布是一种模式

4.5.5. 即使是相互依赖的事件,如果它们受到固定概率的影响,也是一致的

4.6. 马尔可夫链的一个重要性质就是其是无记忆的

4.6.1. 在当前状态下,你可能需要一切可用的事件来预测下一个事件

4.6.2. 这种无记忆性也叫马尔可夫属性

5. 续作者

5.1. 第一个人工智能即兴爵士作曲演奏者

5.2. 弗朗索瓦·帕切特(François Pachet)

5.2.1. 在巴黎担任索尼计算机科学实验室(Sony Computer Science Laboratory)主任期间,帕切特发现人工智能领域的学习工具可以帮他完成作曲的梦想

5.2.2. 他使用概率论中的马尔可夫链公式写出了世界上第一首人工智能即兴爵士乐,并创造了世界上第一个可以进行爵士乐写作的算法

5.2.2.1. 对爵士音乐家的即兴演奏片段进行分析,给定一个音符,分析下一个音符出现的概率

5.2.3. 如果演奏一个特定的音符,那么下一个音符上行或是下行的概率都是50%

5.2.3.1. 基于这样的事实,该算法将在音阶上进行随机抓取
5.2.3.2. 给予算法的即兴演奏次数越多,它分析的数据就越多,某一种特定的演奏风格就会出现越多
5.2.3.3. 不希望算法生成与训练数据雷同的东西,所以回溯过多是没有好处的

5.2.4. 帕切特算法的优点是你可以向其提供实时数据

5.2.5. 这种问句和答句的形式在爵士乐中很常见,因此该算法可以和音乐家进行现场的旋律问答

5.2.5.1. 正因为该算法可以生成与训练数据相同风格的输出内容,所以被称为“续作者”
5.2.5.2. “续作者”会根据它刚刚演奏的内容以及训练数据,来计算下一个特定音符出现的概率,然后以掷骰子的随机模式做出选择

5.2.6. 在另一个版本的算法中,帕切特没有选择问句与答句的“问答模式”,而采用了一种“合作模式”

5.2.6.1. 算法会根据演奏的一段旋律,利用它的概率演算来推测出正确的伴奏和弦,就像真人在伴奏一样

5.3. 伯纳德·鲁巴特(Bernard Lubat)

5.3.1. 一位当代爵士音乐家

5.3.1.1. 对“续作者”进行了测试

5.3.2. 虽然它走在我前面,但毫无疑问它所发挥的一切的源头还是‘我’

5.3.3. “续作者”已经掌握了鲁巴特的音乐世界,但它不是简单地重复他以前做过的事情,而是在探索新的领域

5.3.3.1. 它是一个展示探索性创造力的算法
5.3.3.2. 它还通过向鲁巴特展示他以前从未接触过的方面,来促使其写出的作品更具创造性

5.3.4. 对于鲁巴特来说,这个算法生成的输出内容太有价值了:在算法帮助下,他的作品更具创造性,他也变得更富创造力了

5.3.5. 鲁巴特觉得在某种程度上他受到了身体的限制,而“续作者”却没有,这使得“续作者”有可能比他更有创造力

5.4. 这个算法生成的结果让编写算法的程序员和对算法进行训练的音乐家都感到惊讶,但它所带来的意义不仅仅是创新和令人惊讶而已

5.4.1. 人们都倾向于安于现状、故步自封

5.4.2. “续作者”已经开启了新的音乐世界的大门

5.4.3. 与人类相比,计算机能够更快地完成任务,处理更多的数据,但这一事实可能会导致人类创造力和人工智能创造力之间有趣的紧张关系

5.4.4. 也许在未来,“续作者”将生成只有另一台机器才能欣赏到的“声音”,因为它的复杂性和速度超出了人类的极限

5.5. “续作者”正在以有趣的方式,在体裁、样式、风格方面不断进行着突破

5.5.1. “续作者”的突破,完成了很多了不起的事情

5.6. 虽然它创作的音乐片段在局部是有意义的,甚至是相当令人惊喜的,但基于马尔可夫链系统存在的一些内在局限性,令它的作品最终还是不那么令人满意

5.6.1. 因为这些作品没有总体的全局结构,也就是并没有实现真正意义上的“作曲”

这篇关于读天才与算法:人脑与AI的数学思维笔记17_歌曲的创作公式的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/958795

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig