更新日志

查看产品更新日志，了解产品最新功能和改进。

v0.5.0

2026-05-09

Talking Avatar 与工作区体验打磨

Talking AvatarMy WorksWorkspace UI

这个版本把已经完成的声音进一步连接到可视化输出，并继续打磨工作区体验。

更新内容

将 Lip Sync 统一改名为 Talking Avatar，并同步页面路由和工作区导航。
增加 Talking Avatar 示例，覆盖电影真人、游戏和卡通动画三类场景。
优化 My Works，让声音和视频作品详情都保留在 workspace 框架内。
统一工作区主要视觉颜色，减少杂色，集中使用黑、白和 RoleTTS green。
优化 Browse voices 加载逻辑，滚动到底部时自动加载更多音色。
将旧 demo blog 内容替换为 RoleTTS 产品介绍。

为什么重要

RoleTTS 现在更像一个完整的创作工作区：创建声音、保存音色、回看作品，并把最终声音继续用于 Talking Avatar 输出。

v0.4.0

2026-04-11

带前后对比的声音克隆

Voice CloneBefore AfterReusable Voice

这个版本重点优化声音克隆，让结果更容易试听、判断和保存。

更新内容

增加上传音频和录音两种克隆入口。
增加克隆音色试听区域，支持播放、下载和保存到音色库。
将 Voice Clone 页面拆成输入、试听、已保存音色三个更清晰的模块。
优化前后对比文案，突出音色、语速和声音质感的一致性。

为什么重要

声音克隆的关键不是“生成了一个声音”，而是这个声音是否足够接近原始参考。这个版本让保存前的判断更清楚。

v0.3.0

2026-03-14

基于参考图和 Prompt 的音色设计

Voice DesignReference ImagePrompt

Voice Design 让音色创建不再只依赖文字描述，而是可以加入更直观的视觉参考。

更新内容

增加 Voice Design 工作区，支持通过参考图和 prompt 创建音色。
增加生成后的音频试听，保存前可以先判断结果是否合适。
增加 My Designed Voices，用于管理已经设计出来的音色。
优化示例卡片，展示参考图氛围和 prompt 如何共同影响声音方向。

为什么重要

当预设音色不够贴合角色时，创作者可以直接设计更符合角色设定的新声音。

v0.2.0

2026-02-12

表现力音色库与定向 TTS

340+ VoicesDirected TTSFilters

这个版本重点提升了选音色和试听音色的效率，让角色内容更容易开始。

更新内容

扩展预设音色库，重点覆盖更有表现力的角色音色。
增加语言、性别、年龄、口音和分类筛选。
优化 Text to Speech 页面结构，让脚本、音色、模型和生成按钮保持在同一条流程里。
改进音色试听体验，方便在使用前快速 audition。

为什么重要

创作者可以从更大的音色库开始，并更快筛选出适合当前角色的声音。

v0.1.0

2026-01-15

RoleTTS 工作区基础版本

WorkspaceText to SpeechVoice Library

RoleTTS 的第一个版本围绕一个目标展开：让创作者可以在同一个工作区里完成脚本输入、音色选择和语音生成。

更新内容

增加 Text to Speech 工作区，用于输入脚本并生成音频。
增加基础音色选择流程，并支持保存当前音色状态。
增加音色库基础能力，用于浏览预设角色音色。
增加用户音色状态，让已选择的声音可以在工作区里持续复用。

为什么重要

这个版本搭好了最基础的创作路径：写一句台词，选择一个音色，然后生成声音。