基础知识
度量声音强度,大家最熟悉的单位就是分贝(decibel,缩写为dB)。这是一个无纲量的相对单位,计算公式如下:
分子是测量值的声压,分母是参考值的声压(20微帕,人类所能听到的最小声压)。因此日常中说道声音强度是多少多少分贝时,都是默认了一个很小的参考值的。
而Android设备传感器可以提供的物理量是场的幅值(amplitude),常用下列公式计算分贝值:
从SDK中读取了某段音频数据的振幅后,取最大振幅或平均振幅(可以用平方和平均,或绝对值的和平均),代入上述公式的A1。
现在问题是,作为参考值的振幅A0取多少呢?
博主查阅很多帖子、博文,这里是最一团浆糊的地方。有的博文取600,是基于它视噪音的振幅为600的假设,此时算出来的是相对背景噪音的分贝值,要是用户不对麦克风发出声音,算出的基本都是0分贝。而用户实际使用场景下的背景噪音大小千差万别,咱要是也照葫芦画瓢就不对了,尤其是对于那些制作绝对分贝计的需求,应找出20微帕声压值对应的振幅(或者也可以拿一个标准分贝计做校准参考)。
博主比较懒,把A0定为1,即Android设备麦克风所能”听“到的最小声音振幅。这样拿到测量值振幅直接代入第二个公式的A1中,即可算出分贝值了。
Android API
使用麦克风需要在AndroidManifest.xml里申请相应权限:
- <uses-permission android:name="android.permission.RECORD_AUDIO" />
能够获得音源数据的类有两个:android.media.MediaRecorder和android.media.AudioRecord。
MediaRecorder:
这个类的对象初始化比较麻烦,因为它是被设计用来录制一段完整的音频并写入文件系统中的。但是初始化之后获得振幅却比较方便,我们直接用它的无参方法getMaxAmplitude即可获得一小段时间内音源数据中的最大振幅。不过取最大值的可能弊端是会受到极端数据的影响,使得后来计算的分贝值波动比较大。不过这个方法是很多录音应用计算音量等级所采用的办法。
该方法返回的是0到32767范围的16位整型,原理可能是对一段值域为-32768到32767的音源数据取其中绝对值最大的值并返回。这个值与单位为帕斯卡的声压值是有线性函数关系的。另外需要注意的是第一次调用这个方法取得的值是0,代入公式中算出的分贝值是负无穷大,故需要在代码中对这种情况做判断。可以算出,由于getMaxAmplitude返回的数值最大是32767,因此算出的最大分贝值是90.3。也就是说,博主令参考振幅值为1,计算出的分贝值正常值域为0 dB 到90.3 dB。
演示代码如下,基于hongfa.yy的代码改写:
- package com.example.myapp;
- import java.io.File;
- import java.io.IOException;
- import android.media.MediaRecorder;
- import android.os.Handler;
- import android.util.Log;
- /**
- * amr音频处理
- *
- * @author hongfa.yy
- * @version 创建时间2012-11-21 下午4:33:28
- */
- public class MediaRecorderDemo {
- private final String TAG = "MediaRecord";
- private MediaRecorder mMediaRecorder;
- public static final int MAX_LENGTH = 1000 * 60 * 10;// 最大录音时长1000*60*10;
- private String filePath;
- public MediaRecorderDemo(){
- this.filePath = "/dev/null";
- }
- public MediaRecorderDemo(File file) {
- this.filePath = file.getAbsolutePath();
- }
- private long startTime;
- private long endTime;
- /**
- * 开始录音 使用amr格式
- *
- * 录音文件
- * @return
- */
- public void startRecord() {
- // 开始录音
- /* ①Initial:实例化MediaRecorder对象 */
- if (mMediaRecorder == null)
- mMediaRecorder = new MediaRecorder();
- try {
- /* ②setAudioSource/setVedioSource */
- mMediaRecorder.setAudioSource(MediaRecorder.AudioSource.MIC);// 设置麦克风
- /* ②设置音频文件的编码:AAC/AMR_NB/AMR_MB/Default 声音的(波形)的采样 */
- mMediaRecorder.setOutputFormat(MediaRecorder.OutputFormat.DEFAULT);
- /*
- * ②设置输出文件的格式:THREE_GPP/MPEG-4/RAW_AMR/Default THREE_GPP(3gp格式
- * ,H263视频/ARM音频编码)、MPEG-4、RAW_AMR(只支持音频且音频编码要求为AMR_NB)
- */
- mMediaRecorder.setAudioEncoder(MediaRecorder.AudioEncoder.AMR_NB);
- /* ③准备 */
- mMediaRecorder.setOutputFile(filePath);
- mMediaRecorder.setMaxDuration(MAX_LENGTH);
- mMediaRecorder.prepare();
- /* ④开始 */
- mMediaRecorder.start();
- // AudioRecord audioRecord.
- /* 获取开始时间* */
- startTime = System.currentTimeMillis();
- updateMicStatus();
- Log.i("ACTION_START", "startTime" + startTime);
- } catch (IllegalStateException e) {
- Log.i(TAG,
- "call startAmr(File mRecAudioFile) failed!"
- + e.getMessage());
- } catch (IOException e) {
- Log.i(TAG,
- "call startAmr(File mRecAudioFile) failed!"
- + e.getMessage());
- }
- }
- /**
- * 停止录音
- *
- */
- public long stopRecord() {
- if (mMediaRecorder == null)
- return 0L;
- endTime = System.currentTimeMillis();
- Log.i("ACTION_END", "endTime" + endTime);
- mMediaRecorder.stop();
- mMediaRecorder.reset();
- mMediaRecorder.release();
- mMediaRecorder = null;
- Log.i("ACTION_LENGTH", "Time" + (endTime - startTime));
- return endTime - startTime;
- }
- private final Handler mHandler = new Handler();
- private Runnable mUpdateMicStatusTimer = new Runnable() {
- public void run() {
- updateMicStatus();
- }
- };
- /**
- * 更新话筒状态
- *
- */
- private int BASE = 1;
- private int SPACE = 100;// 间隔取样时间
- private void updateMicStatus() {
- if (mMediaRecorder != null) {
- double ratio = (double)mMediaRecorder.getMaxAmplitude() /BASE;
- double db = 0;// 分贝
- if (ratio > 1)
- db = 20 * Math.log10(ratio);
- Log.d(TAG,"分贝值:"+db);
- mHandler.postDelayed(mUpdateMicStatusTimer, SPACE);
- }
- }
- }
AudioRecord:
这个类可以获得具体的音源数据值。将一段音源数据用read(byte[] audioData, int offsetInBytes, int sizeInBytes)方法从缓冲区读取到我们传入的字节数组audioData后,便可以对其进行操作,如求平方和或绝对值的平均值。这样可以避免个别极端值的影响,使计算的结果更加稳定。求得平均值之后,如果是平方和则代入常数系数为10的公式中,如果是绝对值的则代入常数系数为20的公式中,算出分贝值。
演示代码如下:
- package com.example.myapp;
- import android.media.AudioFormat;
- import android.media.AudioRecord;
- import android.media.MediaRecorder;
- import android.util.Log;
- /**
- * Created by greatpresident on 2014/8/5.
- */
- public class AudioRecordDemo {
- private static final String TAG = "AudioRecord";
- static final int SAMPLE_RATE_IN_HZ = 8000;
- static final int BUFFER_SIZE = AudioRecord.getMinBufferSize(SAMPLE_RATE_IN_HZ,
- AudioFormat.CHANNEL_IN_DEFAULT, AudioFormat.ENCODING_PCM_16BIT);
- AudioRecord mAudioRecord;
- boolean isGetVoiceRun;
- Object mLock;
- public AudioRecordDemo() {
- mLock = new Object();
- }
- public void getNoiseLevel() {
- if (isGetVoiceRun) {
- Log.e(TAG, "还在录着呢");
- return;
- }
- mAudioRecord = new AudioRecord(MediaRecorder.AudioSource.MIC,
- SAMPLE_RATE_IN_HZ, AudioFormat.CHANNEL_IN_DEFAULT,
- AudioFormat.ENCODING_PCM_16BIT, BUFFER_SIZE);
- if (mAudioRecord == null) {
- Log.e("sound", "mAudioRecord初始化失败");
- }
- isGetVoiceRun = true;
- new Thread(new Runnable() {
- @Override
- public void run() {
- mAudioRecord.startRecording();
- short[] buffer = new short[BUFFER_SIZE];
- while (isGetVoiceRun) {
- //r是实际读取的数据长度,一般而言r会小于buffersize
- int r = mAudioRecord.read(buffer, 0, BUFFER_SIZE);
- long v = 0;
- // 将 buffer 内容取出,进行平方和运算
- for (int i = 0; i < buffer.length; i++) {
- v += buffer[i] * buffer[i];
- }
- // 平方和除以数据总长度,得到音量大小。
- double mean = v / (double) r;
- double volume = 10 * Math.log10(mean);
- Log.d(TAG, "分贝值:" + volume);
- // 大概一秒十次
- synchronized (mLock) {
- try {
- mLock.wait(100);
- } catch (InterruptedException e) {
- e.printStackTrace();
- }
- }
- }
- mAudioRecord.stop();
- mAudioRecord.release();
- mAudioRecord = null;
- }
- }).start();
- }
- }
实测结果(设备小米2S),MediaRecorderDemo波动很大,只要对麦克风一吹气,分贝值就能上90:
而AudioRecordDemo就很稳定了,很用力吹气也很难到88以上: