尝试使用gTTS模块将文本转换为语音并另存为wav文件。

我的代码:

import gTTS
text = "This is my text in the saving folder"
tts = gTTS(text)
tts.save('sample.wav')


该文件已保存,但是当我检查文件信息时:

$ mediainfo sample.wav
General
Complete name                            : sample.wav
Format                                   : MPEG Audio
File size                                : 15.8 KiB
Duration                                 : 4 s 32 ms
Overall bit rate mode                    : Constant
Overall bit rate                         : 32.0 kb/s
FileExtension_Invalid                    : m1a mpa1 mp1 m2a mpa2 mp2 mp3

Audio
Format                                   : MPEG Audio
Format version                           : Version 2
Format profile                           : Layer 3
Duration                                 : 4 s 32 ms
Bit rate mode                            : Constant
Bit rate                                 : 32.0 kb/s
Channel(s)                               : 1 channel
Sampling rate                            : 24.0 kHz
Compression mode                         : Lossy
Stream size                              : 15.8 KiB (100%)


为什么我得到不同的保存格式?

最佳答案

您可能无法保存它。 gTTS提供了将音频剪辑另存为mp3的选项。即使您将名称指定为.wav,它也无法识别并使用默认选项进行保存。如果您需要单独使用wav文件,请使用pydub模块更改文件格式。

from pydub import AudioSegment
sound = AudioSegment.from_mp3("myfile.mp3")
sound.export("myfile.wav", format="wav")

关于python - gTTS错误:另存为WAV但另存为MPEG,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/50720152/

10-12 20:07