我有一个类使用android tts api将文本转换为音频。我可以控制音高和速度;但是我注意到引擎需要一个文本字符串和一个散列对象。我注意到有些单词发音太快,不容易识别,而且词形变化似乎太不自然。有没有办法控制这两件事?可能是通过HashMap?以下是我如何使用引擎:

    mTts = new TextToSpeech(Globals.context, this); // context, listener
}

@Override
public void onInit(int status) {
    HashMap<String, String> myHashRender = new HashMap();
    myHashRender.put(TextToSpeech.Engine.KEY_PARAM_UTTERANCE_ID, speech);
    mTts.setPitch(0.8f);
    mTts.setSpeechRate(0.6f);
    mTts.synthesizeToFile(speech, myHashRender, fileOutPath);
    while (mTts.isSpeaking()) try {
        Thread.sleep(100);
    } catch (InterruptedException e) {
        e.printStackTrace();
    }
    mTts.stop();
    mTts.shutdown();

最佳答案

google tts目前不支持这一点,但您可以这样做:在解析文本的过程中,您可以更改文本的部分内容,以获得所需的语调和屈折变化。
例如,如果遇到“hey”这个词,在发送到tts引擎以获得不同的发音之前,可以将其动态重写为“heeey”。
它不漂亮,但它是一个解决办法。

08-05 19:34