
该项目实现了一个实时语音交互的数字人,支持多种语音方案,包括 GLM-4-Voice 和 ASR-LLM-TTS。用户可以根据需求自定义数字人的外观和声音,而无需进行训练,音色克隆功能让用户能够轻松创建个性化的语音体验。初始加载延迟低至 3 秒,适合各种应用场景。
开源地址:https:// github .com/Henry-23/VideoChat
盘天下 | 免费网盘资源分享(pantx.cn),该项目实现了一个实时语音交互的数字人,支持多种语音方案,包括GLM-4-Voice和ASR-LLM-TTS。用户可以根据需求自定义数字人的外观和声音,而无需进行训练,音色克隆功能让用户能够轻松创建个性化的语音体验。初始加载延迟低至3秒,适合各种应用场景。 开源地址:https://github...
评论列表
发表评论