FireRedTTS

小红书开源的先进文本转语音系统

基于大语言模型，支持零样本语音克隆和情感语音生成

立即下载查看教程

核心特性

仅需几秒钟的参考音频即可模仿任意音色和说话风格

支持多种情绪表达（愤怒、快乐、悲伤等）和丰富的副语言特征

支持中文、英文及中英混合文本处理

支持流式语音合成，降低延迟，提升用户体验

FireRedTTS-2是小红书FireRed团队推出的第二代文本转语音系统，专为多说话者对话生成设计。该系统提供稳定、自然的语音输出，同时实现可靠的说话人切换和语境感知的韵律控制。

了解更多访问GitHub

展示不同角色之间的自然对话转换

演示音频 (占位)

展现丰富的情感语音生成能力

演示音频 (占位)

实时流式语音合成效果展示

演示音频 (占位)

是的，FireRedTTS完全开源，基于MIT许可证发布。您可以在GitHub上找到完整的源代码，并根据需要自由使用、修改和分发。

FireRedTTS支持Windows、Linux和macOS主流操作系统。我们提供了详细的安装指南，帮助您在不同平台上快速部署。

FireRedTTS-2是第二代版本，专为多说话者对话生成设计，支持长篇流式合成、语境感知韵律控制，并增强了系统稳定性。相比第一代，性能和自然度都有显著提升。

FireRedTTS采用零样本语音克隆技术，仅需几秒钟（通常3-5秒）的参考音频即可生成高质量的个性化语音，无需复杂的训练过程。

FireRedTTS支持中文、英文及中英混合文本处理。我们正在持续扩展语言支持，未来将支持更多语种。

您可以通过GitHub Issues提交问题，或加入我们的开发者社区获取帮助。我们也提供详细的文档和教程，帮助您快速上手。