跟着AI学AI_05音频处理库 librosa 简介

本文主要是介绍跟着AI学AI_05音频处理库 librosa 简介，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

在这里插入图片描述
librosa 是一个用于音频和音乐分析的 Python 库，特别适合处理音乐信息检索（MIR）任务。它提供了丰富的工具和函数来处理音频信号，从基础的音频加载和播放，到高级的特征提取和可视化。以下是 librosa 的一些主要功能和使用示例。

主要功能

音频加载和保存：
- 加载音频文件：librosa.load
- 保存音频文件：librosa.output.write_wav
时间和频率操作：
- 计算时域和频域特征（如MFCC、色度、谱图等）
- 音调和速度调整
- 时间对齐和音频分割
特征提取：
- 梅尔频率倒谱系数（MFCC）：librosa.feature.mfcc
- 色度特征：librosa.feature.chroma_stft
- 谱图：librosa.feature.melspectrogram
- 零交叉率、短时能量等
音频效果：
- 滤波器应用
- 时域和频域变换
- 音频增益调整
可视化：
- 波形图：librosa.display.waveplot
- 频谱图：librosa.display.specshow
- 色度图等

安装

你可以使用 pip 安装 librosa：

pip install librosa

示例

下面是一些常见的 librosa 用法示例：

1. 加载音频文件

import librosa# 加载音频文件
y, sr = librosa.load('path/to/audio/file.wav', sr=None)  # y 是音频时间序列，sr 是采样率

2. 绘制音频波形

import matplotlib.pyplot as plt
import librosa.display# 绘制波形
plt.figure(figsize=(12, 4))
librosa.display.waveplot(y, sr=sr)
plt.title('Waveform')
plt.show()

3. 计算并绘制梅尔频谱图

# 计算梅尔频谱图
S = librosa.feature.melspectrogram(y, sr=sr, n_mels=128)# 转换为分贝（dB）
S_db = librosa.power_to_db(S, ref=np.max)# 绘制梅尔频谱图
plt.figure(figsize=(12, 4))
librosa.display.specshow(S_db, sr=sr, x_axis='time', y_axis='mel', cmap='coolwarm')
plt.colorbar(format='%+2.0f dB')
plt.title('Mel Spectrogram')
plt.show()

4. 提取MFCC特征

# 提取MFCC特征
mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=13)# 绘制MFCC特征
plt.figure(figsize=(12, 4))
librosa.display.specshow(mfccs, sr=sr, x_axis='time')
plt.colorbar()
plt.title('MFCC')
plt.show()

5. 时间拉伸和音调移位

# 时间拉伸
y_stretched = librosa.effects.time_stretch(y, rate=1.5)# 音调移位
y_shifted = librosa.effects.pitch_shift(y, sr, n_steps=4)

6. 短时傅里叶变换 (STFT)

# 计算STFT
D = librosa.stft(y)
D_db = librosa.amplitude_to_db(np.abs(D), ref=np.max)# 绘制STFT
plt.figure(figsize=(12, 4))
librosa.display.specshow(D_db, sr=sr, x_axis='time', y_axis='log')
plt.colorbar(format='%+2.0f dB')
plt.title('STFT')
plt.show()

总结

librosa 是一个功能强大且灵活的音频处理库，特别适合音乐和音频信号分析。它提供了从基础的音频加载和处理，到高级的特征提取和可视化的全套工具，使得音频信号处理变得更加简单和高效。通过结合librosa 提供的各种功能，你可以轻松地进行音频数据的处理和分析。

在这里插入图片描述
librosa 是由 Brian McFee 开发并由开源社区进行维护和扩展的音频处理库。Brian McFee 是一位在音乐信息检索（Music Information Retrieval, MIR）领域颇有声望的研究人员，他目前在纽约大学（New York University, NYU）工作，担任数据科学与音乐技术领域的助理教授。