非常自然的文本转语音(Text To Speech)TTS,支持中英文混读,还可以穿插笑声,听起来很真实自然。
1、有哪些优点
2、安装
克隆
git clone https://github.com/2noise/ChatTTS
如果是国内访问,不是很稳定,大多时候会出现如下错误:
国外站点,你懂得,所以需要多试几次,或者直接去里面进行下载。或者就是科学上网。
3、创建虚拟环境
一般新的项目,使用新的环境,这里创建一个名叫tts的虚拟环境,可以自己指定Python版本
conda create -n tts python=3.10
安装好了之后,就激活tts,进入到这个虚拟环境
activate tts
安装需要的库,在requirements.txt都有指定,如下图:
4、安装requirements.txt
所以我们只需要输入如下命令,会自动安装所有相关需要的库:
cd ChatTTS
pip install -r requirements.txt
或者
conda install --yes --file requirements.txt
5、运行
当然这里如果没有安装IPython,输入命令:pip install ipython
也可以使用.ipynb文件的方法来运行:
import torch
torch._dynamo.config.cache_size_limit = 64
torch._dynamo.config.suppress_errors = True
torch.set_float32_matmul_precision('high')
import ChatTTS
from IPython.display import Audio
chat = ChatTTS.Chat()
chat.load_models()
# Use force_redownload=True if the weights updated.
# chat.load_models(force_redownload=True)
# If you download the weights manually, set source='locals'.
# chat.load_models(source='locals', local_path='YOUR LOCAL PATH')
texts = ["Hello,Jianping",]*3 \
+ ["大家好,今天天气真好[laugh],秦迷天下,我们去爬山吧[uv_break],Very Nice"]*3
wavs = chat.infer(texts)
Audio(wavs[0], rate=24_000, autoplay=True)
这样就将上面的文字转成语音了。
当然在这个过程中还会遇到不同的问题,然后针对错误进行特定的处理即可。
赶快学起来吧,一个非常棒的开源模型!