tensorflow - 如何在TensorFlow图中读取Ogg或MP3音频文件？ | tf

tf

javascript - 只有在鼠标单击并从元素上移出鼠标后，才初始化悬停状态

javascript - meteor :当页面刷新或另一个页面位置时，如何保留dom操作？

php - 在 session 类中检查用户代理并重新生成 session ID

c# - 如何在 ASP.NET Identity 中使用和 ASP.NET Membership 数据库？

html - 居中并向左对齐- bootstrap

android - 父布局角不可见，因为选择器重叠

javascript - d3.format中的可变精度

php - Wordpress 查询帖子将每个项目包装在一个 div 而不是 li 中，并显示当前页面的后代

css - 如何缩放SVG路径以适合窗口大小？

ios - 使用*运算符获取存储在地址中的数据

c# - .NET Excel文件解析器

javascript - 可以使用jquery .ajax()调用来解析包含xml数据的javascript对象吗？

intellij-idea - IntelliJ IDEA中查看模式的快捷方式

ruby-on-rails - Backbone.js或Ember.js与Ruby on Rails

mysql - 如何通过SQL中的另一列选择具有MAX(列值)，DISTINCT的行？

tensorflow - 如何在TensorFlow图中读取Ogg或MP3音频文件？

扫码查看

我已经在TensorFlow中看到了像tf.image.decode_png这样的图像解码器，但是如何读取音频文件(WAV，Ogg，MP3等)呢？没有TFRecord是否可能？

例如。像this这样的东西:

filename_queue = tf.train.string_input_producer(['my-audio.ogg'])
reader = tf.WholeFileReader()
key, value = reader.read(filename_queue)
my_audio = tf.audio.decode_ogg(value)

最佳答案

是的，软件包tensorflow.contrib.ffmpeg中有特殊的解码器。要使用它，您需要先安装ffmpeg。

例子:

audio_binary = tf.read_file('song.mp3')
waveform = tf.contrib.ffmpeg.decode_audio(audio_binary, file_format='mp3', samples_per_second=44100, channel_count=2)

关于tensorflow - 如何在TensorFlow图中读取Ogg或MP3音频文件？，我们在Stack Overflow上找到一个类似的问题：https://stackoverflow.com/questions/41109652/

10-12 00:18