FireRedTTS 版本說明

了解FireRedTTS的發展歷程和版本特性

FireRedTTS-2

最新版FireRedTTS-2 特點 長對話語音生成:目前支援 4 分鐘、4 個角色的對話,通過擴展訓練語料庫可以輕鬆擴展到更多角色和更長的對話。

查看詳情

FireRedTTS-1

2024年9月發布的第一版,FireRedTTS 是基礎版文本轉語音系統,支援零樣本語音克隆和情感語音生成。

查看詳情

2025年

FireRedTTS-2 發布

為了滿足更複雜的多說話者對話生成需求,團隊推出了FireRedTTS-2。該版本專為長篇流式文本轉語音設計,提供更自然的語音輸出和可靠的說話人切換能力。

核心特性

  • 面向多說話者對話生成的長篇流式文本轉語音系統
  • 語境感知的韻律控制,生成更自然的語音
  • 增強的說話人切換能力
  • 改進的系統架構,提升長時間運行穩定性
  • 優化的流式合成性能

2024年9月

FireRedTTS-1 發布

小紅書FireRed團隊發布了首個FireRedTTS版本,基於大語言模型的文本轉語音系統。該版本支援零樣本語音克隆、情感語音生成等功能,為用戶提供高品質的語音合成體驗。

核心特性

  • 基於大語言模型的文本轉語音系統
  • 零樣本語音克隆,僅需幾秒參考音頻
  • 豐富的情感語音生成能力
  • 支援中文、英文及中英混合文本處理
  • 流式解碼器,降低合成延遲

版本對比

特性 FireRedTTS-1 FireRedTTS-2
主要應用場景 單說話人語音合成 多說話人對話生成
合成方式 批處理合成 流式合成
說話人切換 基礎支援 優化支援
語境感知 有限支援 深度支援
長篇內容處理 分段處理 連續流式處理
系統穩定性 良好 增強