当用户将网络合成语音设置为默认值时,我的应用程序将缓存常见的请求,以防止将来出现网络延迟。
我是如何做到这一点的,在我的代码here中演示过。简单地说,它将引擎名和语句与请求匹配,如果它们匹配,我将流式传输缓存的音频,而不是使用tts引擎。
如果用户随后在android文本到语音设置中更改音调和语音速率,则缓存的音频当然不再反映这一点,需要忽略和“重新缓存”,或者相应地操纵音频。
我的问题是:如何获得系统的默认设置,音高和语速。
要设置音高和速率,可以在TextToSpeech API中使用公开的方法:

/**
 * Sets the speech rate.
 *
 * This has no effect on any pre-recorded speech.
 *
 * @param speechRate Speech rate. {@code 1.0} is the normal speech rate,
 *            lower values slow down the speech ({@code 0.5} is half the normal speech rate),
 *            greater values accelerate it ({@code 2.0} is twice the normal speech rate).
 *
 * @return {@link #ERROR} or {@link #SUCCESS}.
 */
public int setSpeechRate(float speechRate) {
    if (speechRate > 0.0f) {
        int intRate = (int)(speechRate * 100);
        if (intRate > 0) {
            synchronized (mStartLock) {
                mParams.putInt(Engine.KEY_PARAM_RATE, intRate);
            }
            return SUCCESS;
        }
    }
    return ERROR;
}

/**
 * Sets the speech pitch for the TextToSpeech engine.
 *
 * This has no effect on any pre-recorded speech.
 *
 * @param pitch Speech pitch. {@code 1.0} is the normal pitch,
 *            lower values lower the tone of the synthesized voice,
 *            greater values increase it.
 *
 * @return {@link #ERROR} or {@link #SUCCESS}.
 */
public int setPitch(float pitch) {
    if (pitch > 0.0f) {
        int intPitch = (int)(pitch * 100);
        if (intPitch > 0) {
            synchronized (mStartLock) {
                mParams.putInt(Engine.KEY_PARAM_PITCH, intPitch);
            }
            return SUCCESS;
        }
    }
    return ERROR;
}

鉴于上述两种方法都会将值放入绑定tts引擎的Private Bundle中(link):
private final Bundle mParams = new Bundle();

我使用反射来查看这些值是由绑定引擎默认的/持久的还是注入的。下面是一个简明的示例,其中the Class扩展TextToSpeech
private int getSpeechRate() {

    Bundle reflectBundle;

    try {

        final Field f = this.getClass().getSuperclass().getDeclaredField(TTSDefaults.BOUND_PARAMS);
        f.setAccessible(true);
        reflectBundle = (Bundle) f.get(this);

        if (reflectBundle != null && !reflectBundle.isEmpty()) {
                examineBundle(reflectBundle);

            if (reflectBundle.containsKey(TTSDefaults.KEY_PARAM_RATE)) {

                final int reflectRate = reflectBundle.getInt(TTSDefaults.KEY_PARAM_RATE);

                // log

                return reflectRate;

            } else {
                // missing
            }

        } else {
            // empty or null
        }

    } catch (final NoSuchFieldException e) {
    } catch (final IllegalAccessException e) {
    } catch (final NullPointerException e) {
    }

    return -1;
}

/**
 * For debugging the bundle extras
 *
 * @param bundle containing potential extras
 */
private void examineBundle(@Nullable final Bundle bundle) {

    if (bundle != null) {
        final Set<String> keys = bundle.keySet();
        //noinspection Convert2streamapi
        for (final String key : keys) {
            Log.v(CLS_NAME, "examineBundle: " + key + " ~ " + bundle.get(key));
        }
    }
}

这些价值观是缺失的,因此,也许可以理解,这并不是它们“全球”持续存在的方式。
当我第一次试图解决这个问题的时候,我以为它是微不足道的-我希望事实证明是这样的,但我只是看不到树木的树林…
谢谢你阅读这篇文章-救命!

最佳答案

首先,我假设您熟悉texttospeech源代码。
我不认为你能通过反射得到音高和语速。这些值存储在texttospeech类的一个实例变量中,并且在每次查询文本时都会被赋予引擎。这意味着当您调用setSpeechRatesetPitch方法时,它们不会改变全局文本到语音设置的音调和语音速率。
除此之外,pitchspeech rate在android安全系统设置中定义,这些设置是用户必须通过系统ui或专用api(系统应用程序或根访问)显式修改这些值的首选项,而不是由应用程序直接修改。
使用以下代码读取与音调和语音速率相关的安全设置:

Settings.Secure.getInt(getContentResolver(), Settings.Secure.TTS_DEFAULT_RATE);
Settings.Secure.getInt(getContentResolver(), Settings.Secure.TTS_DEFAULT_PITCH);

Google TalkbackTextToSpeechSettings中可以看到稍有不同的用法。
Settings.SettingNotFoundException包围,如果未设置任何值,则会抛出该值,在这种情况下,您可以返回到the hiddenTextToSpeech.Engine.FALLBACK_TTS_DEFAULT_PITCH的等效值。
或者,可以在中添加一个额外的参数作为默认值。
Settings.Secure.getInt(getContentResolver(), Settings.Secure.TTS_DEFAULT_PITCH, FALLBACK_TTS_DEFAULT_PITCH);

08-07 04:38