今天,我在python中使用来自librosa的MFCC和以下代码。它给出了一个维为(40,40)的数组。

import librosa

sound_clip, s = librosa.load(filename.wav)
mfcc=librosa.feature.mfcc(sound_clip, n_mfcc=40, n_mels=60)

有没有类似的方法可以从另一个库中提取GFCC?我找不到
librosa。

例如essentia:

https://essentia.upf.edu/documentation/essentia_python_tutorial.html
https://essentia.upf.edu/documentation/reference/std_GFCC.html
import essentia
import essentia.standard

essentia.standard.GFCC

#Get array with dimension (40,40)

最佳答案

我一直面临类似的问题,因此我编写了一个名为spafe的小型库,该库简化了从音频文件中提取特征的过程。支持的功能包括GFCC。可以按照以下步骤进行提取:

import scipy
from spafe.features.gfcc import gfcc

# read wav
fs, sig = scipy.io.wavfile.read("test.wav")

# compute features
gfccs = gfcc(sig, fs=fs, num_ceps=13)

您可以在gfcc-features-example下找到完整的GFCC提取示例(作为一本jupyter笔记本)。

所有可能的输入变量及其含义的文档位于gfcc-docs下。

gfcc实现已完成,如下所示paper
python - 如何在Python中获取GFCC而不是MFCC?-LMLPHP

关于python - 如何在Python中获取GFCC而不是MFCC?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/56091965/

10-09 17:10