我正在尝试将音频文件导出到LINEAR16进行Google Speech,我注意到它们指定了小尾数字节顺序。我正在使用pydub导出为“原始”格式,但是我无法从文档(或源代码)中判断导出的文件是小端格式还是大端格式?
我正在使用以下命令进行导出:
audio = pydub.from_file(self.mFilePathName, "mp4")
fullFileNameRaw = "audio.raw"
audio.export(fullFileNameRaw, format='raw')
谢谢。
-K
最佳答案
根据this answer,标准(RIFF)波形文件为小端格式。 Pydub使用stdlib wave
模块来编写wave文件,所以我猜它是小端的。 (如果您使用wave header 写入文件,实际上它的开头确实有RIFF)。
不过,进一步研究似乎似乎取决于硬件平台的字节序。 x86和AMD64都是小端,因此基本上可以覆盖人们运行pydub的所有地方(我想?)