因此,我正在研究音符发作检测。我在这里实现了该方法:Note onset detection
但是,我发现该方法的“静态”性质有些困难或问题。我正在寻找如何使阈值方法“动态”。但是我在寻找合适的解决方案时遇到了麻烦。
除此之外,我还致力于代替振幅值作为通过阈值的基础,而是利用两个振幅值之间的“差”来了解信号何时增加或不增加以及增加了多少。或减少。这就是我目前正在使用的。
是否有人愿意帮助或已经解决了此类问题?谢谢!
此外,任何人都有这个论文的PDF文件:http://www.mendeley.com/research/methods-detecting-impulsive-noise-speech-audio-signals-14/
最佳答案
音量压缩是AGC(自动增益控制)的一种形式,并且AGC可以动态完成。在搜索结果中可以找到很多接近实时的AGC算法,但是如果您想要比步进函数更平滑的AGC攻击,则需要一些延迟。