给定一个22 mins (1320 secs)
音频文件,Librosa将通过以下方式提取MFCC功能:data = librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, **kwargs)
我的问题是它如何计算56829。是否有任何计算可实现此框架?每帧的窗口大小是多少?
最佳答案
您可以指定跳长
mfcc = librosa.feature.mfcc(y=y, sr=sr, hop_length=hop_length, n_mfcc=13)
librosa使用居中框架,因此第k帧以样本k * hop_length为中心
我认为默认跳数值为512,您的数据(1320 * 22050)/ 56829 = 512,16
关于python - Librosa:MFCC特征计算,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/38149210/