我想用ruby构建语音识别引擎。我知道我永远不会到达那里,只是为了好玩。我需要获取存储在wav文件中的声音频率的数据,以便与我已经具有要识别的不同声音的数据进行比较。
我将用ruby编写代码,但是我不认为有任何库可以用ruby编写,如果有的话它们会太慢。
关于ruby的好处是,我将能够通过IronRuby或.ru通过Java使用.net库。
我如何获得频率数据?

最佳答案

波形文件并不太复杂,实质上,它只是一系列音频样本:http://www-mmsp.ece.mcgill.ca/Documents/AudioFormats/WAVE/WAVE.html

一旦您可以读取样本,下一步将是通过FFT转换运行它们,以获取频率内容。应该可以使用一些开源实现,也可以自己实现。

您尝试做的事情需要对音频和信号处理背后的数学有所了解,因此也许您想从一本有关该主题的书开始。

09-27 02:03
查看更多