本文介绍了只对数字(1到10000)进行语音识别的接口还是sdk?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我需要一个专门的解决方案来检测1到1000之间的数字,以便在智能手机上使用。最好的解决方案是让这个SDK脱机工作。有什么想法吗?我找不到Google Speech或Amazon Transcribe的任何配置以允许"仅数字"
推荐答案
从人们那里得到数字是不太对的,即使你向他们要数字,他们通常也会说很多话,比如"我不知道"或"稍等一下"。您将严重损害体验。
您必须智能地分析识别结果,即使识别出非数字,您也必须相应地操作。
要提高数字的准确性,可以使用Google Speech API的word hint feature。只需添加数字和其他必填字作为提示,谷歌就会更准确地识别它们。亚马逊也有这个功能,他们称之为"custom vocabulary"。
如果您想使用离线API,您当然可以尝试Kaldi。你可以adapt Kaldi vocabulary用数字来提高准确度,它会比Google API好得多。
这篇关于只对数字(1到10000)进行语音识别的接口还是sdk?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持!