Step-Audio-EditX V5 一鍵啟動
1115(Update)Step-Audio-EditX _V5名 稱:Step-Audio-EditX
軟體版本: V5
軟體類型:一鍵啟動
檔案大小:17GB
Step-Audio-EditX 是階躍星辰開源的全球首個 LLM 級音頻編輯大模型,主打“情感、說話風格、副語言”三軸細粒度迭代控制,可把憤怒、開心、悲傷等情緒強度任意增減,能把撒嬌、耳語、老人等風格疊加多次,能像字幕一樣插入呼吸、笑聲、嘆氣等 10 類自然副語言 token。自帶零樣本 TTS,無需目標人語音即可克隆音色,在文本前加“[四川話]”“[粵語]”等標簽秒切方言。模型完全基於大間隔合成數據做 SFT+PPO,後訓練階段無需額外編碼器或 adapter 能實現屬性解耦與迭代控制。
檔案下載
下載 左邊1115
Step-Audio-EditX 是階躍星辰開源的全球首個 LLM 級音頻編輯大模型,主打“情感、說話風格、副語言”三軸細粒度迭代控制。這個軟体很實用,感謝大大分享 !! 感謝大大無私提供上傳及分享!
頁:
[1]