menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

開源視頻生成模型





  • 在 DeepSeek 席捲全球之際,被稱為 AI 大模型「六小龍」之一的階躍星辰近日又聯合吉利汽車開源了 Step-Video-T2V 和 Step-Audio 語音模型,而前者一經問世更榮登「全球最強開源視頻模型」寶座,再次驚豔世界,就連 Hugging Face 大老都驚呼道:「簡直就是下一個 DeepSeek!」階躍星辰自行研發的 Step-Video-T2V 是全球參數量最大的開源視頻生成模型,參數量 300 億,可直接生成 204 幀、540P 解析度高品質視頻,而 Step-Audio 則是行業內首款產品級開源語音交互模型,能根據不同場景生成情緒、方言、語種、歌聲和個人化風格,和使用者自然地高品質對話。