我正在尝试创建可以通过热键激活的语音识别功能。我找到了这个
snowboy软件包,可以创建一个热词侦听器,该侦听器可以全天候监听并在激活时运行特定任务。
我的问题是我需要在检测到热门单词时运行语音身份验证功能。假设我的口号是“你好”,而我的语音认证的输入需求是“你好,请开门”。但是,如果我在检测到热门单词后开始录制,则需要重复打招呼。我如何获得完整的“你好,请开门”录音而不重复。
有没有一种方式,snowboy可以输出用于激活的短音频文件“hello”,如果是的话,我可以将它们组合在一起。
如果现在可以创建一个音频缓冲区,该缓冲区将始终保留麦克风数据的最后10秒钟,而不会对CPU造成很大的影响。同时,这也需要与雪人共享麦克风。
这是我的主意,但我不知道如何实现。请告诉我我该怎么做或其他我可以得到完整的录音。
随意编辑问题是某个地方不清楚。
谢谢!!
最佳答案
是。检测到后,默认情况下,Snowboy会播放在资源文件夹中找到的“叮”波形文件。您可以编辑snowboydecoder.HotwordDetector函数来播放另一个声音文件,而不是ding(您可能需要大致了解其编译语言)。您可以下载自定义wave文件在此处播放,也可以使用互联网上各种免费的TTS API列表生成“机器人声音”自定义消息,并将其保存到计算机中。如果需要,我将提供详细的解释