
该项目实现了一个实时语音交互的 数字人 ,支持多种语音方案,包括 GLM-4-Voice 和 ASR-LLM-TTS。用户可以根据需求自定义数字人的外观和声音,而无需进行训练,音色克隆功能让用户能够轻松创建个性化的语音体验。初始加载延迟低至 3 秒,适合各种应用场景。
开源地址:https:// github .com/Henry-23/VideoChat

该项目实现了一个实时语音交互的 数字人 ,支持多种语音方案,包括 GLM-4-Voice 和 ASR-LLM-TTS。用户可以根据需求自定义数字人的外观和声音,而无需进行训练,音色克隆功能让用户能够轻松创建个性化的语音体验。初始加载延迟低至 3 秒,适合各种应用场景。
开源地址:https:// github .com/Henry-23/VideoChat
1. 本站资源仅供学习和交流,须在下载后24小时内删除!
2. 本站资源不得用于非法商业用途,不得违反国家法律!
3. 本站资源链接若无法下载或失效,请联系管理员处理!
本站不制作和存储任何资源,仅供个人学习用途,版权归原著作权人所有,如涉版权问题请留言反馈!
Copyright © 2025 盘天下 | 免费精选资源分享
加载 0.9369 秒, 内存 1.49 MB , 数据库 26 次
评论列表
发表评论