我有一个音频文件,我想分割成多个文件。这些文件被构造成成对的声音,并被静音分开。时间线看起来像这样-代表沉默:

-----声音A1 -----声音A2 -----声音B1 -----声音B2 -----

我想找到声音A2和声音B1之间的边界。我想要一个最好结合使用Python,OpenCV和FFmpeg的解决方案,但是任何有效的工具都可以。

最佳答案

感谢Miki提供的链接。 Aubio是一个完美运行的工具。 aubioquiet程序将检测静默边界并打印其时间戳:
$ aubioquiet temp.wavNOISY: 0.638549QUIET: 2.008526NOISY: 4.992290QUIET: 6.286803NOISY: 9.258957QUIET: 10.559275NOISY: 13.531428QUIET: 14.622766NOISY: 17.623945QUIET: 18.953287NOISY: 21.931248QUIET: 23.260590NOISY: 26.238548QUIET: 27.643356NOISY: 30.632925QUIET: 31.915827NOISY: 34.882175QUIET: 36.165081

关于python - 检测音频文件中的声音边界,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/31764821/

10-12 23:54