我在Windows XP系统上安装了Sphinx-4,并设置了JSAPI。我想将英文WAV(或MP3)文件转录为文本。
当我运行"WavFile" demo时-它运行成功。

java -jar WavFile.jar

但是,当我像这样传递自己的wav文件时:
java -jar WavFile.jar c:\test.wav

我得到:

正在加载在'jar:file:/ C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/config.xml'中定义的Recognizer ...
解码jar:文件:/ C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar!/edu/cmu/sphinx/demo/wavfile/12345.wav
结果:一二三四有五

看来此演示已设置为加载和运行内部wav文件(“ 12345.wav”)或其他内容。
我已经阅读了文档,只是无法弄清楚如何设置“ config.xml”或什至将其放置在哪个目录中。我只是在尝试使用标准演示来获得运行概念的简单证明。
因此,问题是:如何运行Sphinx4程序来转录WAV文件?
谢谢。

最佳答案

需要编写一个使用CMU词典(美国英语)而不是Transcriber.jar支持的数字的新应用程序(基于Transcriber.java)。

Sphinx没有提供如此有用的示例是很奇怪的。

关于speech-recognition - 获取WAV文件转录以与Sphinx4一起使用,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/1516863/

10-15 11:30