Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。












想改善这个问题吗?更新问题,以便将其作为on-topic用于堆栈溢出。

5年前关闭。



Improve this question




我想写一个代码来检测婴儿的哭声。我正在使用Windows作为平台。目前,我能够获取音频样本及其频率图(使用FFT),但不确定如何继续进行。

我想问一下,根据婴儿的时频图,我应该采取什么步骤来检测婴儿的哭声。

我看到了一些方法,例如在语音识别中采用中值滤波器,然后是HMM。但是对于简单的声音检测,我需要采用这种复杂的方法吗?

如果您能帮助我,我将不胜感激。

最佳答案

隐藏的马尔可夫模型广泛用于语音识别中,但是由于您实际上不需要知道宝宝在说什么(下一个项目:婴儿翻译),因此我认为这不是您所需要的。

您可能应该做的是查看许多婴儿哭泣的频谱图,并寻找模式。或者,甚至更好的是,让您的算法做到这一点。您要做的是计算有关您的声音的某些指标MFCCs
例如,您对1000个哭声样本进行了此操作,然后有1000个度量 vector 。

现在,您可以为每个指标计算标准偏差。这为您提供了一种方法,可以告诉随机的婴儿声音样本与平均的哭声有何不同。

这听起来很难,但是我知道那里有工具。看看狮身人面像。您可能可以训练上类。

但是无论哪种方式,都应从收集婴儿哭泣的声音开始;)(但不要偷糖果)

关于audio - 婴儿哭声检测,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/31368124/

10-10 01:47