doudou10722 發表於 2025-5-29 18:44:46

TIGER-audio-extraction 一鍵啟動

軟體名稱:TIGER-audio-extraction(多用途語音分離模型)
軟體版本:New
軟體類型:一鍵啟動
軟體語言: 多語 簡
檔案大小:3.1Gb




TIGER 是一種羽量級語音分離模型,通過頻段分割、多尺度及全頻幀建模有效提取關鍵聲學特徵。該專案由來自清華大學主導研發,通過頻率帶分割、多尺度以及全頻率幀建模的方式,有效地提取關鍵聲學特徵,從而實現高效的語音分離。TIGER 模型大小不到20M,即使CPU也可以流暢運行,且支援人聲伴奏分離(音訊檔中分離人聲和伴奏)、音訊說話人分離(從多個說話人音訊中分離出每個說話人的聲音)、視頻降噪以及視頻語音分離等功能。
應用領域 ‌
語音通信‌:在多人語音通信場景中,TIGER可以有效分離出各個說話人的聲音,提高通話品質和清晰度。 ‌智能語音辨識‌:在智慧家居、車載系統等智慧語音辨識應用中,TIGER能夠説明系統更準確地識別使用者的指令,提升使用者體驗。 ‌音訊處理軟體‌:作為音訊處理軟體中的一個元件,TIGER可以用於音訊編輯、混音等場景,實現音訊信號的精細分離和處理。 ‌遠端教育和會議‌:在遠端教育和線上會議中,TIGER能夠分離出各個參與者的聲音,減少背景雜音和干擾,提高溝通效率。
使用說明:
(CPU可流暢運行。建議N卡,顯存4G起。支援50系顯卡,基於CUDA12.8)

檔案下載
下載 (進門左下0529)

pig55570 發表於 2025-5-29 21:35:15

TIGER-audio-extraction -- 是一種羽量級語音分離模型,通過頻段分割、多尺度及全頻幀建模有效提取關鍵聲學特徵。這個軟体很實用,感謝大大分享 !!
頁: [1]
查看完整版本: TIGER-audio-extraction 一鍵啟動