FireRedTTS 版本說明
了解FireRedTTS的發展歷程和版本特性
2025年
FireRedTTS-2 發布
為了滿足更複雜的多說話者對話生成需求,團隊推出了FireRedTTS-2。該版本專為長篇流式文本轉語音設計,提供更自然的語音輸出和可靠的說話人切換能力。
核心特性
- 面向多說話者對話生成的長篇流式文本轉語音系統
- 語境感知的韻律控制,生成更自然的語音
- 增強的說話人切換能力
- 改進的系統架構,提升長時間運行穩定性
- 優化的流式合成性能
2024年9月
FireRedTTS-1 發布
小紅書FireRed團隊發布了首個FireRedTTS版本,基於大語言模型的文本轉語音系統。該版本支援零樣本語音克隆、情感語音生成等功能,為用戶提供高品質的語音合成體驗。
核心特性
- 基於大語言模型的文本轉語音系統
- 零樣本語音克隆,僅需幾秒參考音頻
- 豐富的情感語音生成能力
- 支援中文、英文及中英混合文本處理
- 流式解碼器,降低合成延遲
版本對比
特性 | FireRedTTS-1 | FireRedTTS-2 |
---|---|---|
主要應用場景 | 單說話人語音合成 | 多說話人對話生成 |
合成方式 | 批處理合成 | 流式合成 |
說話人切換 | 基礎支援 | 優化支援 |
語境感知 | 有限支援 | 深度支援 |
長篇內容處理 | 分段處理 | 連續流式處理 |
系統穩定性 | 良好 | 增強 |