我有一个类使用android tts api将文本转换为音频。我可以控制音高和速度;但是我注意到引擎需要一个文本字符串和一个散列对象。我注意到有些单词发音太快,不容易识别,而且词形变化似乎太不自然。有没有办法控制这两件事?可能是通过HashMap
?以下是我如何使用引擎:
mTts = new TextToSpeech(Globals.context, this); // context, listener
}
@Override
public void onInit(int status) {
HashMap<String, String> myHashRender = new HashMap();
myHashRender.put(TextToSpeech.Engine.KEY_PARAM_UTTERANCE_ID, speech);
mTts.setPitch(0.8f);
mTts.setSpeechRate(0.6f);
mTts.synthesizeToFile(speech, myHashRender, fileOutPath);
while (mTts.isSpeaking()) try {
Thread.sleep(100);
} catch (InterruptedException e) {
e.printStackTrace();
}
mTts.stop();
mTts.shutdown();
最佳答案
google tts目前不支持这一点,但您可以这样做:在解析文本的过程中,您可以更改文本的部分内容,以获得所需的语调和屈折变化。
例如,如果遇到“hey”这个词,在发送到tts引擎以获得不同的发音之前,可以将其动态重写为“heeey”。
它不漂亮,但它是一个解决办法。