F5-TTS：上海交大开源超逼真声音克隆 TTS-盘天下资源网

F5-TTS：上海交大开源超逼真声音克隆 TTS

一款基于流匹配的全非自回归文本到语音转换系统，零样本，支持声音克隆、速度控制、控制语音情感表现、长文本合成、中英文多语言合成，并支持商用。

不需要复杂的设计如持续时间模型、文本编码器和音素对齐，能够快速训练并实现实时因素（RTF）0.15 的推理速度，显著优于当前基于扩散的 TTS 模型。

F5-TTS 在公共的 100K 小时多语言数据集上进行训练，展现出高自然性和表现力的零样本能力、无缝代码切换能力和速度控制效率。

开源地址：https:// github .com/SWivid/F5-TTS

夸克资源精选合集

「电影」 「电视剧」 「大尺度」 「恐怖片」 「动漫」 「付费短剧」 「广播剧」 「纪录片」 「软件工具」 「音乐」 「教程」 「网赚」 「书库」 「小说」 「综艺」

关于本页

盘天下资源网 | 免费网盘资源分享（www.pantx.cn），一款基于流匹配的全非自回归文本到语音转换系统，零样本，支持声音克隆、速度控制、控制语音情感表现、长文本合成、中英文多语言合成，并支持商用。不需要复杂的设计如持续时间模型、文本编码器和音素对齐，能够快速训练并实现实时因素（RTF）0.15 的推理速度，显著优于当前基于扩散的 TTS 模型。 F...