今天,我在python中使用来自librosa的MFCC和以下代码。它给出了一个维为(40,40)的数组。
import librosa
sound_clip, s = librosa.load(filename.wav)
mfcc=librosa.feature.mfcc(sound_clip, n_mfcc=40, n_mels=60)
有没有类似的方法可以从另一个库中提取GFCC?我找不到
librosa。
例如essentia:
https://essentia.upf.edu/documentation/essentia_python_tutorial.html
https://essentia.upf.edu/documentation/reference/std_GFCC.html
import essentia
import essentia.standard
essentia.standard.GFCC
#Get array with dimension (40,40)
最佳答案
我一直面临类似的问题,因此我编写了一个名为spafe的小型库,该库简化了从音频文件中提取特征的过程。支持的功能包括GFCC。可以按照以下步骤进行提取:
import scipy
from spafe.features.gfcc import gfcc
# read wav
fs, sig = scipy.io.wavfile.read("test.wav")
# compute features
gfccs = gfcc(sig, fs=fs, num_ceps=13)
您可以在gfcc-features-example下找到完整的GFCC提取示例(作为一本jupyter笔记本)。
所有可能的输入变量及其含义的文档位于gfcc-docs下。
gfcc实现已完成,如下所示paper
关于python - 如何在Python中获取GFCC而不是MFCC?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/56091965/