Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。












想要改善这个问题吗?更新问题,以便将其作为on-topic用于堆栈溢出。

5年前关闭。



Improve this question




是否有任何免费服务/程序可以将音频转录为文本
并保留时间戳?

我想抄写:

This is the demo link of VoiceBase

(419个骗子之间的16m对话;骗子与
重音,所以我不是在提示质量
转录)。

Voicebase确实会转录,但是转录是一个单一的块
测试,没有加盖时间戳。

我还尝试了Google语音“技巧”(将文件记录到语音邮件中
并让Google一次将其转录3分钟),但同样,
转录是单个文本块,没有时间戳。

我知道Sphinx,但无法正常工作。

我意识到我可以使用subtitleditor创建手动字幕,
但我正在寻找一种自动化的解决方案。

理想情况下,我想带时间戳的机器转录并手工编辑。

最佳答案

CMUSphinx可以做到这一点,只需从源代码运行Aligner演示即可。最新的sphinx4教程可通过in sphinx4 tutorial获得。在2014年夏季,CMUSphinx在sphinx4主干中集成了long audio alignment功能。

这是完全错误的,但与语音库不同,它至少捕获了一些单词。手动进行转录和稍后分配时间可能更容易。 CMUSphinx也可以通过音频到文本的对齐方式来做到这一点。

重音和短话引起的解码精度问题很多,但您也要负责。例如,您永远不要将8khz bandwith的电话音频转换为mp3。这种转换大大降低了自动语音识别的准确性和总体记录质量。您可以使用其他面向语音的无损编解码器进行压缩。

其他question讨论了该主题,并列出了一些建议。

09-13 13:41