我正在用avcodec_decode_audio3用ffmpeg将aac解码为pcm。但是,它解码为AV_SAMPLE_FMT_FLTP样本格式(PCM 32位浮点平面),我需要AV_SAMPLE_FMT_S16(PCM 16位带符号-S16LE)。

我知道ffmpeg可以使用-sample_fmt轻松做到这一点。我想对代码做同样的事情,但是我仍然无法弄清楚。

audio_resample不适用于:它失败,并显示错误消息:....转换失败。

最佳答案

编辑2013年4月9日:找出如何使用libswresample来做到这一点……快得多!

在过去2-3年中的某个时候,FFmpeg的AAC解码器的输出格式从AV_SAMPLE_FMT_S16更改为AV_SAMPLE_FMT_FLTP。这意味着每个音频通道都有其自己的缓冲区,每个样本值都是一个32位浮点值,范围从-1.0到+1.0。

而使用AV_SAMPLE_FMT_S16时,数据在单个缓冲区中,并且样本被交错,并且每个样本都是从-32767到+32767的有符号整数。

而且,如果您确实需要音频为AV_SAMPLE_FMT_S16,则必须自己进行转换。我想出了两种方法:

1.使用libswresample(推荐)

#include "libswresample/swresample.h"

...

SwrContext *swr;

...

// Set up SWR context once you've got codec information
swr = swr_alloc();
av_opt_set_int(swr, "in_channel_layout",  audioCodec->channel_layout, 0);
av_opt_set_int(swr, "out_channel_layout", audioCodec->channel_layout,  0);
av_opt_set_int(swr, "in_sample_rate",     audioCodec->sample_rate, 0);
av_opt_set_int(swr, "out_sample_rate",    audioCodec->sample_rate, 0);
av_opt_set_sample_fmt(swr, "in_sample_fmt",  AV_SAMPLE_FMT_FLTP, 0);
av_opt_set_sample_fmt(swr, "out_sample_fmt", AV_SAMPLE_FMT_S16,  0);
swr_init(swr);

...

// In your decoder loop, after decoding an audio frame:
AVFrame *audioFrame = ...;
int16_t* outputBuffer = ...;
swr_convert(&outputBuffer, audioFrame->nb_samples, audioFrame->extended_data, audioFrame->nb_samples);


这就是您要做的!

2.用C手动完成(不建议使用原始答案)

因此,在您的解码循环中,当您获得音频数据包时,可以像下面这样解码:

AVCodecContext *audioCodec;   // init'd elsewhere
AVFrame *audioFrame;          // init'd elsewhere
AVPacket packet;              // init'd elsewhere
int16_t* outputBuffer;        // init'd elsewhere
int out_size = 0;
...
int len = avcodec_decode_audio4(audioCodec, audioFrame, &out_size, &packet);


然后,如果您有完整的音频帧,则可以轻松转换它:

    // Convert from AV_SAMPLE_FMT_FLTP to AV_SAMPLE_FMT_S16
    int in_samples = audioFrame->nb_samples;
    int in_linesize = audioFrame->linesize[0];
    int i=0;
    float* inputChannel0 = (float*)audioFrame->extended_data[0];
    // Mono
    if (audioFrame->channels==1) {
        for (i=0 ; i<in_samples ; i++) {
            float sample = *inputChannel0++;
            if (sample<-1.0f) sample=-1.0f; else if (sample>1.0f) sample=1.0f;
            outputBuffer[i] = (int16_t) (sample * 32767.0f);
        }
    }
    // Stereo
    else {
        float* inputChannel1 = (float*)audioFrame->extended_data[1];
        for (i=0 ; i<in_samples ; i++) {
             outputBuffer[i*2] = (int16_t) ((*inputChannel0++) * 32767.0f);
             outputBuffer[i*2+1] = (int16_t) ((*inputChannel1++) * 32767.0f);
        }
    }
    // outputBuffer now contains 16-bit PCM!


为了清楚起见,我省去了几件事...理想情况下,单声道路径中的钳位应该在立体声路径中复制。并且可以轻松地优化代码。

08-17 02:57