RoleTTS

更新日志

查看产品更新日志,了解产品最新功能和改进。

v0.5.0

Talking Avatar 与工作区体验打磨

Talking AvatarMy WorksWorkspace UI

这个版本把已经完成的声音进一步连接到可视化输出,并继续打磨工作区体验。

更新内容

  • 将 Lip Sync 统一改名为 Talking Avatar,并同步页面路由和工作区导航。
  • 增加 Talking Avatar 示例,覆盖电影真人、游戏和卡通动画三类场景。
  • 优化 My Works,让声音和视频作品详情都保留在 workspace 框架内。
  • 统一工作区主要视觉颜色,减少杂色,集中使用黑、白和 RoleTTS green。
  • 优化 Browse voices 加载逻辑,滚动到底部时自动加载更多音色。
  • 将旧 demo blog 内容替换为 RoleTTS 产品介绍。

为什么重要

RoleTTS 现在更像一个完整的创作工作区:创建声音、保存音色、回看作品,并把最终声音继续用于 Talking Avatar 输出。

v0.4.0

带前后对比的声音克隆

Voice CloneBefore AfterReusable Voice

这个版本重点优化声音克隆,让结果更容易试听、判断和保存。

更新内容

  • 增加上传音频和录音两种克隆入口。
  • 增加克隆音色试听区域,支持播放、下载和保存到音色库。
  • 将 Voice Clone 页面拆成输入、试听、已保存音色三个更清晰的模块。
  • 优化前后对比文案,突出音色、语速和声音质感的一致性。

为什么重要

声音克隆的关键不是“生成了一个声音”,而是这个声音是否足够接近原始参考。这个版本让保存前的判断更清楚。

v0.3.0

基于参考图和 Prompt 的音色设计

Voice DesignReference ImagePrompt

Voice Design 让音色创建不再只依赖文字描述,而是可以加入更直观的视觉参考。

更新内容

  • 增加 Voice Design 工作区,支持通过参考图和 prompt 创建音色。
  • 增加生成后的音频试听,保存前可以先判断结果是否合适。
  • 增加 My Designed Voices,用于管理已经设计出来的音色。
  • 优化示例卡片,展示参考图氛围和 prompt 如何共同影响声音方向。

为什么重要

当预设音色不够贴合角色时,创作者可以直接设计更符合角色设定的新声音。

v0.2.0

表现力音色库与定向 TTS

340+ VoicesDirected TTSFilters

这个版本重点提升了选音色和试听音色的效率,让角色内容更容易开始。

更新内容

  • 扩展预设音色库,重点覆盖更有表现力的角色音色。
  • 增加语言、性别、年龄、口音和分类筛选。
  • 优化 Text to Speech 页面结构,让脚本、音色、模型和生成按钮保持在同一条流程里。
  • 改进音色试听体验,方便在使用前快速 audition。

为什么重要

创作者可以从更大的音色库开始,并更快筛选出适合当前角色的声音。

v0.1.0

RoleTTS 工作区基础版本

WorkspaceText to SpeechVoice Library

RoleTTS 的第一个版本围绕一个目标展开:让创作者可以在同一个工作区里完成脚本输入、音色选择和语音生成。

更新内容

  • 增加 Text to Speech 工作区,用于输入脚本并生成音频。
  • 增加基础音色选择流程,并支持保存当前音色状态。
  • 增加音色库基础能力,用于浏览预设角色音色。
  • 增加用户音色状态,让已选择的声音可以在工作区里持续复用。

为什么重要

这个版本搭好了最基础的创作路径:写一句台词,选择一个音色,然后生成声音。