Seed-TTS：真假难辨的 AI 语音-工具盒子

先听这一段

由 AI 完成的小说配音

该技术由 Seed 团队贡献

相关论文

https://arxiv.org/abs/2406.02430

在线体验

https://bytedancespeech.github.io/seedtts_tech_report/

下面是详细体验

由好基友「小互」激情投稿

赞赏和文末广告收入，都归「小互」

简介

Seed-TTS 是由字节跳动开发的一种高级文本到语音（TTS）模型系列，能够生成高质量、几乎无法与人类语音区分的语音。该模型可以基于简短的语音片段生成高度自然且富有表现力的语音。

情绪控制

Seed-TTS 可以对包括但不限于情感、语调、说话风格等。通过精调，可以生成个钟不同属性的语音，满足各种需求。

可控的属性：

栩栩如生

Seed-TTS 生产的语音很有表现力，能模拟复杂的情感和语境，非常适合小说、视频配音。

Zero-shot（翻译场景）

即便没有任何的训练数据，Seed-TTS 也能基于简短的语音片段生成高质量的语音，在临时场景中很有用。

Zero-shot（情绪控制）

内容编辑

支持语音内容编辑和说话速度编辑，使得用户可以根据需要对生成的语音进行灵活调整。

视频翻译

中文转英文（中文）

中文转英文（英文）

中文转英文（中文带口型）

中文转英文（英文带口型）

大聪明补充道

请大家自己看论文

https://arxiv.org/abs/2406.02430

自己玩

https://bytedancespeech.github.io/seedtts_tech_report/

51工具盒子