我试图找到一种简单的方法将音频文件转录为文本(CMU Sphinx、Julius 等对于不了解语音识别、配置语言模型、声学模型等的人来说很难)。

我想知道是否有办法将我的音频文件传输到 Mac OS 10.9 Mavericks 的“增强听写”功能中,该功能允许本地离线语音听写。

当我将耳机插孔中的跳线插入线路时,我以为我很聪明,但不幸的是,当您开始听写时,它会将所有其他音频播放静音(有关如何禁用此静音的任何建议都会得到我的正确答案)。

最佳答案

我还没有找到直接的方法来做到这一点。但是,您可以使用 Soundflower 作为解决方法。

例如,您可以在 VLC 中为您的输出选择 Audio->Audio Device->Soundflower (2ch)。然后在 System Preferences->Dictation & Speech->Dictation->Soundflower (2ch) [麦克风图标下的下拉菜单]。然后您可以在 VLC 中开始播放,并开始听写(例如在 TextEdit 中),您应该会看到转录出现。这种方法的缺点是它很慢(仅限于音频的实时播放),并且不太有利于自动化工作流程。

注意:在切换到 TextEdit 和启动 ED 之前,您必须开始音频播放。

关于macos - 在 Mac OS X Mavericks 中是否有 API(或任何黑客)来访问增强型听写?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/19579566/

10-08 22:35