给定一个22 mins (1320 secs)音频文件,Librosa将通过以下方式提取MFCC功能:data = librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, **kwargs)


我的问题是它如何计算56829。是否有任何计算可实现此框架?每帧的窗口大小是多少?

最佳答案

您可以指定跳长

mfcc = librosa.feature.mfcc(y=y, sr=sr, hop_length=hop_length, n_mfcc=13)

librosa使用居中框架,因此第k帧以样本k * hop_length为中心

我认为默认跳数值为512,您的数据(1320 * 22050)/ 56829 = 512,16

关于python - Librosa:MFCC特征计算,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/38149210/

10-12 14:06