我是音频处理的新手。所以请原谅我的无知。

根据维基百科,通常x轴表示时间,y轴表示频率,反之亦然。颜色强度表示特定时间和频率下的振幅(能量)。这很容易理解。

我无法解释pylab API中specgram产生的频谱图。

上图分别绘制了具有不同窗口大小(128,512,1024)的频谱图。显然,x轴是频率。 y轴上0到1.0之间的值代表什么?

如果有人能对此有所启发,我将非常感激。

最佳答案

通过查看图像以及波形图和频谱图之间的相关性,您不能正确地假设x轴为频率。

x轴是时间。我猜想它是在样本中测量的。目前尚不清楚为什么频谱图具有x标记的时域图只有一半。

彩色频谱图上的y轴是频率,很可能是从0到Nyquist(半采样率)进行归一化。例如,假设采样率为8000Hz,则y轴[0.0,1.0]-> [0.0Hz,4000Hz]

10-07 21:34