当用户将网络合成语音设置为默认值时,我的应用程序将缓存常见的请求,以防止将来出现网络延迟。
我是如何做到这一点的,在我的代码here中演示过。简单地说,它将引擎名和语句与请求匹配,如果它们匹配,我将流式传输缓存的音频,而不是使用tts引擎。
如果用户随后在android文本到语音设置中更改音调和语音速率,则缓存的音频当然不再反映这一点,需要忽略和“重新缓存”,或者相应地操纵音频。
我的问题是:如何获得系统的默认设置,音高和语速。
要设置音高和速率,可以在TextToSpeech API中使用公开的方法:
/**
* Sets the speech rate.
*
* This has no effect on any pre-recorded speech.
*
* @param speechRate Speech rate. {@code 1.0} is the normal speech rate,
* lower values slow down the speech ({@code 0.5} is half the normal speech rate),
* greater values accelerate it ({@code 2.0} is twice the normal speech rate).
*
* @return {@link #ERROR} or {@link #SUCCESS}.
*/
public int setSpeechRate(float speechRate) {
if (speechRate > 0.0f) {
int intRate = (int)(speechRate * 100);
if (intRate > 0) {
synchronized (mStartLock) {
mParams.putInt(Engine.KEY_PARAM_RATE, intRate);
}
return SUCCESS;
}
}
return ERROR;
}
/**
* Sets the speech pitch for the TextToSpeech engine.
*
* This has no effect on any pre-recorded speech.
*
* @param pitch Speech pitch. {@code 1.0} is the normal pitch,
* lower values lower the tone of the synthesized voice,
* greater values increase it.
*
* @return {@link #ERROR} or {@link #SUCCESS}.
*/
public int setPitch(float pitch) {
if (pitch > 0.0f) {
int intPitch = (int)(pitch * 100);
if (intPitch > 0) {
synchronized (mStartLock) {
mParams.putInt(Engine.KEY_PARAM_PITCH, intPitch);
}
return SUCCESS;
}
}
return ERROR;
}
鉴于上述两种方法都会将值放入绑定tts引擎的
Private Bundle
中(link):private final Bundle mParams = new Bundle();
我使用反射来查看这些值是由绑定引擎默认的/持久的还是注入的。下面是一个简明的示例,其中the Class扩展
TextToSpeech
:private int getSpeechRate() {
Bundle reflectBundle;
try {
final Field f = this.getClass().getSuperclass().getDeclaredField(TTSDefaults.BOUND_PARAMS);
f.setAccessible(true);
reflectBundle = (Bundle) f.get(this);
if (reflectBundle != null && !reflectBundle.isEmpty()) {
examineBundle(reflectBundle);
if (reflectBundle.containsKey(TTSDefaults.KEY_PARAM_RATE)) {
final int reflectRate = reflectBundle.getInt(TTSDefaults.KEY_PARAM_RATE);
// log
return reflectRate;
} else {
// missing
}
} else {
// empty or null
}
} catch (final NoSuchFieldException e) {
} catch (final IllegalAccessException e) {
} catch (final NullPointerException e) {
}
return -1;
}
/**
* For debugging the bundle extras
*
* @param bundle containing potential extras
*/
private void examineBundle(@Nullable final Bundle bundle) {
if (bundle != null) {
final Set<String> keys = bundle.keySet();
//noinspection Convert2streamapi
for (final String key : keys) {
Log.v(CLS_NAME, "examineBundle: " + key + " ~ " + bundle.get(key));
}
}
}
这些价值观是缺失的,因此,也许可以理解,这并不是它们“全球”持续存在的方式。
当我第一次试图解决这个问题的时候,我以为它是微不足道的-我希望事实证明是这样的,但我只是看不到树木的树林…
谢谢你阅读这篇文章-救命!
最佳答案
首先,我假设您熟悉texttospeech源代码。
我不认为你能通过反射得到音高和语速。这些值存储在texttospeech类的一个实例变量中,并且在每次查询文本时都会被赋予引擎。这意味着当您调用setSpeechRate
或setPitch
方法时,它们不会改变全局文本到语音设置的音调和语音速率。
除此之外,pitch和speech rate在android安全系统设置中定义,这些设置是用户必须通过系统ui或专用api(系统应用程序或根访问)显式修改这些值的首选项,而不是由应用程序直接修改。
使用以下代码读取与音调和语音速率相关的安全设置:
Settings.Secure.getInt(getContentResolver(), Settings.Secure.TTS_DEFAULT_RATE);
Settings.Secure.getInt(getContentResolver(), Settings.Secure.TTS_DEFAULT_PITCH);
在Google Talkback和TextToSpeechSettings中可以看到稍有不同的用法。
用
Settings.SettingNotFoundException
包围,如果未设置任何值,则会抛出该值,在这种情况下,您可以返回到the hiddenTextToSpeech.Engine.FALLBACK_TTS_DEFAULT_PITCH
的等效值。或者,可以在中添加一个额外的参数作为默认值。
Settings.Secure.getInt(getContentResolver(), Settings.Secure.TTS_DEFAULT_PITCH, FALLBACK_TTS_DEFAULT_PITCH);