Python编曲实践(六):将MIDI文件转化成矩阵,继承PyTorch的Dataset类来构建数据集(附数据集网盘下载链接)

本文主要是介绍Python编曲实践(六):将MIDI文件转化成矩阵,继承PyTorch的Dataset类来构建数据集(附数据集网盘下载链接),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

上篇文章中,我介绍了如何通过编写爬虫来从 Free Midi Files Download 网站上爬取海量的MIDI数据。本篇文章介绍的是使用 pretty_midi 库来将MIDI文件转化成矩阵,并通过PyTorch的Dataset类来构建数据集,为之后的训练与测试中传入张量做准备。

实施过程

将MIDI文件转化成稀疏矩阵信息并存储

构建数据集的第一步是将MIDI文件中的音乐信息以(时间,音高)的矩阵形式提取出来,并以稀疏矩阵的形式来保存到npz文件中。pretty_midi库提供了在每一个音轨中遍历音符(Note),并得到每个音符的音高(pitch),音符开始时间(note_on)和音符结束时间(note_off),将开始和结束时间分别除以十六分音符的长度(60秒 / 120BPM / 4),就可以得到开始和结束的时间在矩阵中对应的位置。

代码详见 MusicCritique/util/data/create_database.py

def generate_nonzeros_by_notes():root_dir = 'E:/merged_midi/'midi_collection = get_midi_collection()genre_collection = get_genre_collection()for genre in genre_collection.find():genre_name = genre['Name']print(genre_name)npy_file_root_dir = 'E:/midi_matrix/one_instr/' + genre_name + '/'if not os.path.exists(npy_file_root_dir):os.mkdir(npy_file_root_dir)for midi in midi_collection.find({'Genre': genre_name, 'OneInstrNpyGenerated': False}, no_cursor_timeout = True):path = root_dir + genre_name + '/' + midi['md5'] + '.mid'save_path = npy_file_root_dir + midi['md5'] + '.npz'pm = pretty_midi.PrettyMIDI(path)# segment_num = math.ceil(pm.get_end_time() / 8)note_range = (24, 108)# data = np.zeros((segment_num, 64, 84), np.bool_)nonzeros = []sixteenth_length = 60 / 120 / 4for instr in pm.instruments:if not instr.is_drum:for note in instr.notes:start = int(note.start / sixteenth_length)end = int(note.end / sixteenth_length)pitch = note.pitchif pitch < note_range[0] or pitch >= note_range[1]:continueelse:pitch -= 24for time_raw in range(start, end):segment = int(time_raw / 64)time = time_raw % 64nonzeros.append([segment, time, pitch])nonzeros = np.array(nonzeros)np.savez_compressed(save_path, nonzeros)midi_collection.update_one({'_id': midi['_id']}, {'$set': {'OneInstrNpyGenerated': True}})print('Progress: {:.2%}'.format(midi_collection.count({'Genre': genre_name, 'OneInstrNpyGenerated': True}) / midi_collection.count({'Genre': genre_name})), end='\n')
  • 为了方便存储,我将每个MIDI文件以四个小节为单位进行分割,考虑到的最短时长单位是十六分音符,这样每个矩阵的第一维度大小是64(4*16),代表音符在时间上的分布情况。
  • MIDI文件音高数值范围在0~127,可以存储从A0到G9的横跨10个八度的音高,对应关系可以参考 MIDI NOTE NUMBERS AND CENTER FREQUENCIES 。在这些音里面很多音符是几乎不会出现在真实的音乐中的。为了使得到的矩阵更为稠密,在处理的过程中忽略了过大和过小的数值,只提取了数值在24-108的音符,即C1-C8这84个音高,基本上与钢琴的音域相同。
  • 最后,同样为了矩阵更为稠密,提高训练效果,我将除去鼓轨外的所有乐器音轨合成到一起,统一记录音符,而不区分乐器种类。

考虑到以上三点,根据每一个MIDI文件得到的矩阵形式即[包含的四小节乐段数*1*64*84]。为了降低空间占用,保存在文件中的信息是矩阵中每一个非零点的坐标信息,后面可以通过这些坐标来构建稀疏矩阵。

合并某个风格的所有稀疏矩阵

通过上一步,我们已经将MIDI文件中的音乐信息以稀疏矩阵坐标的形式存储在了单独的npz文件中,为了方便构造数据集,我尝试将每个风格的所有稀疏矩阵统一存储。
代码详见 MusicCritique/util/data/create_database.py

def merge_all_sparse_matrices():midi_collection = get_midi_collection()genre_collection = get_genre_collection()root_dir = 'E:/midi_matrix/one_instr/'time_step = 64valid_range = (24, 108)for genre in genre_collection.find({'DatasetGenerated': False}):save_dir = 'd:/data/' + genre['Name']if not os.path.exists(save_dir):os.mkdir(save_dir)print(genre['Name'])whole_length = genre['ValidPiecesNum']shape = np.array([whole_length, time_step, valid_range[1]-valid_range[0]])processed = 0last_piece_num = 0whole_num = midi_collection.count({'Genre': genre['Name']})non_zeros = []for midi in midi_collection.find({'Genre': genre['Name']}, no_cursor_timeout=True):path = root_dir + genre['Name'] + '/' + midi['md5'] + '.npz'valid_pieces_num = midi['PiecesNum'] - 1f = np.load(path)matrix = f['arr_0'].copy()print(valid_pieces_num, matrix.shape[0])for data in matrix:try:data = data.tolist()if data[0] < valid_pieces_num:piece_order = last_piece_num + data[0]non_zeros.append([piece_order, data[1], data[2]])except:print(path)last_piece_num += valid_pieces_numprocessed += 1print('Progress: {:.2%}\n'.format(processed / whole_num))non_zeros = np.array(non_zeros)print(non_zeros.shape)np.savez_compressed(save_dir + '/data_sparse' + '.npz', nonzeros=non_zeros, shape=shape)genre_collection.update_one({'_id': genre['_id']}, {'$set': {'DatasetGenerated': True}})

这个函数中genre的ValidPiecesNum域是之前添加的,意义是某一类的所有MIDI文件的四小节数目之和,并从这之中扣除了最后不满一小节的部分。

将稀疏矩阵转化为矩阵

由于所有的非零的坐标信息已经保存在了npz文件中,通过遍历这些坐标信息并将这些坐标点的数值设置为1.0,就可以得到矩阵。

def generate_sparse_matrix_of_genre(genre):npy_path = 'D:/data/' + genre + '/data_sparse.npz'with np.load(npy_path) as f:shape = f['shape']data = np.zeros(shape, np.float_)nonzeros = f['nonzeros']for x in nonzeros:data[(x[0], x[1], x[2])] = 1.return data

继承Dataset类,编写自定义数据集

通过继承PyTorch的Dataset类,并对几个重要函数进行重写,参考官方文档
代码详见 MusicCritique/util/data/dataset.py

class SteelyDataset(data.Dataset):def __init__(self, genreA, genreB, phase, use_mix):assert phase in ['train', 'test'], 'not valid dataset type'sources = ['metal', 'punk', 'folk', 'newage', 'country', 'bluegrass']genre_collection = get_genre_collection()self.data_path = 'D:/data/'numA = genre_collection.find_one({'Name': genreA})['ValidPiecesNum']numB = genre_collection.find_one({'Name': genreB})['ValidPiecesNum']train_num = int(min(numA, numB) * 0.9)test_num = min(numA, numB) - train_numif phase is 'train':self.length = train_numif use_mix:dataA = np.expand_dims(generate_sparse_matrix_of_genre(genreA)[:self.length], 1)dataB = np.expand_dims(generate_sparse_matrix_of_genre(genreB)[:self.length], 1)mixed = generate_sparse_matrix_from_multiple_genres(sources)np.random.shuffle(mixed)data_mixed = np.expand_dims(mixed[:self.length], 1)self.data = np.concatenate((dataA, dataB, data_mixed), axis=1)else:dataA = np.expand_dims(generate_sparse_matrix_of_genre(genreA)[:self.length], 1)dataB = np.expand_dims(generate_sparse_matrix_of_genre(genreB)[:self.length], 1)self.data = np.concatenate((dataA, dataB), axis=1)else:self.length = test_numdataA = np.expand_dims(generate_sparse_matrix_of_genre(genreA)[:self.length], 1)dataB = np.expand_dims(generate_sparse_matrix_of_genre(genreB)[:self.length], 1)self.data = np.concatenate((dataA, dataB), axis=1)def __getitem__(self, index):return self.data[index, :, :, :]def __len__(self):return self.length

继承的重点是重写初始化函数、getitem函数和len函数。在构建数据库的时候,为了方便调用数据,我将dataA和dataB合并到了一起,并取较小数据集的数目来确定总体数据集数目,以保证两种数据大小一致,在这过程中使用了Numpy库中的expand_dims函数来增加维度,concatenate函数来把两个矩阵合并到新增的维度上。

数据集分享

大家需要的话可以通过 百度云 下载这一数据集,提取码:nsfi。如在使用过程中遇到问题,请在下面评论,感谢阅读!

这篇关于Python编曲实践(六):将MIDI文件转化成矩阵,继承PyTorch的Dataset类来构建数据集(附数据集网盘下载链接)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/927549

相关文章

python管理工具之conda安装部署及使用详解

《python管理工具之conda安装部署及使用详解》这篇文章详细介绍了如何安装和使用conda来管理Python环境,它涵盖了从安装部署、镜像源配置到具体的conda使用方法,包括创建、激活、安装包... 目录pytpshheraerUhon管理工具:conda部署+使用一、安装部署1、 下载2、 安装3

Python进阶之Excel基本操作介绍

《Python进阶之Excel基本操作介绍》在现实中,很多工作都需要与数据打交道,Excel作为常用的数据处理工具,一直备受人们的青睐,本文主要为大家介绍了一些Python中Excel的基本操作,希望... 目录概述写入使用 xlwt使用 XlsxWriter读取修改概述在现实中,很多工作都需要与数据打交

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

在C#中获取端口号与系统信息的高效实践

《在C#中获取端口号与系统信息的高效实践》在现代软件开发中,尤其是系统管理、运维、监控和性能优化等场景中,了解计算机硬件和网络的状态至关重要,C#作为一种广泛应用的编程语言,提供了丰富的API来帮助开... 目录引言1. 获取端口号信息1.1 获取活动的 TCP 和 UDP 连接说明:应用场景:2. 获取硬

使用Python实现在Word中添加或删除超链接

《使用Python实现在Word中添加或删除超链接》在Word文档中,超链接是一种将文本或图像连接到其他文档、网页或同一文档中不同部分的功能,本文将为大家介绍一下Python如何实现在Word中添加或... 在Word文档中,超链接是一种将文本或图像连接到其他文档、网页或同一文档中不同部分的功能。通过添加超

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

利用Python编写一个简单的聊天机器人

《利用Python编写一个简单的聊天机器人》这篇文章主要为大家详细介绍了如何利用Python编写一个简单的聊天机器人,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 使用 python 编写一个简单的聊天机器人可以从最基础的逻辑开始,然后逐步加入更复杂的功能。这里我们将先实现一个简单的

Linux使用dd命令来复制和转换数据的操作方法

《Linux使用dd命令来复制和转换数据的操作方法》Linux中的dd命令是一个功能强大的数据复制和转换实用程序,它以较低级别运行,通常用于创建可启动的USB驱动器、克隆磁盘和生成随机数据等任务,本文... 目录简介功能和能力语法常用选项示例用法基础用法创建可启动www.chinasem.cn的 USB 驱动

基于Python开发电脑定时关机工具

《基于Python开发电脑定时关机工具》这篇文章主要为大家详细介绍了如何基于Python开发一个电脑定时关机工具,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 简介2. 运行效果3. 相关源码1. 简介这个程序就像一个“忠实的管家”,帮你按时关掉电脑,而且全程不需要你多做