本文介绍了编写语音识别引擎的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

因此,像其他许多人一样,我决定创建自己的语音识别引擎。事实证明,这并不容易,相反,对于英语语言来说,实现这一目标相当困难,因为我想说,一个单词的书写方式和发音方式之间存在着巨大的差异。作为格鲁吉亚人,我决定编写乔治亚语的语音识别软件。在乔治亚语中,单词的发音与您所写的完全相同。它就像一份抄本。这一事实会大大减轻我的任务吗?或者有更难的.困难:D?

推荐答案

语音识别是一个复杂的领域,有许多特定的算法、工具和方法。要创建您自己的引擎,您可以从CMUSphinx开源语音识别工具包开始,它将允许您:

  • 收集和处理支持格鲁吉亚语所需的数据
  • 创建格鲁吉亚语模型
  • 实现格鲁吉亚语语音识别引擎。
  • 使用引擎创建在桌面、服务器或iPhone上运行的语音识别应用程序(通过OpenEars)

CMUSphinx已经支持英语、德语、西班牙语、法语、荷兰语、俄语、普通话、冰岛语、意大利语和许多其他语言。添加一个新的是非常简单的。对于新人来说,通常需要一两个月的集中工作来实施所需的流程。

要开始使用,请访问主页:

http://cmusphinx.sourceforge.net

并阅读教程

http://cmusphinx.sourceforge.net/wiki/tutorial

如果您有任何问题,请在论坛或此处提问!

而且,当你说乔治亚语时,你只拼写发音是一个非常常见的误解。对于世界上大多数语言来说,情况并非如此。为了验证这一假设,尝试在音频编辑器中录制一些音频,并检查哪些声音是实际发音的。你会大吃一惊。上面的教程详细介绍了此问题。

这篇关于编写语音识别引擎的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!

09-11 06:31