A股港股

字節跳動發表文生圖開放模型SDXL-Lightning

鉅亨網新聞中心2024-02-23 21:50

據陸媒《界面新聞》報導，字節發表文生圖開放模型 SDXL-Lightning。AI 開源社群 Hugging Face 的最新名單，SDXL-Lightning 躋身模型趨勢榜，同時也成為 Hugging Face Spaces 上的熱門模型。

cover image of news article — 字節跳動發表文生圖開放模型SDXL-Lightning(圖:shutterstock)

報導稱，與 SDXL-Lightning 一同上榜的，是 Google 新推出的「最強開放大模型」Gemma 系列，以及 Stability AI 的新一代文生圖模型 Stable Cascade。

‌

在影像生成領域，先進模型的生成技術依賴擴散過程，就是把雜訊逐步轉換為影像樣本的迭代。這個過程通常需要 20 到 40 次呼叫神經網絡，不僅會耗費龐大的運算資源，生成速度也比較慢。產生一張高品質影像，大約需要 5 秒。

知情人士透露，字節跳動的 SDXL-Lightning 透過漸進式對抗蒸餾的技術，實現前所未有的生成速度。此模型能夠在 2 步或 4 步內產生極高品質和解析度的影像，將產生速度加快十倍，是 1024 解析度下速度最快的文生圖模型，計算成本則降低為十分之一。

字節跳動智慧創作團隊對回應稱，開源開放的浪潮已成為推動人工智慧快速發展的關鍵力量，SDXL-Lightning 模型基於已有繁榮生態的文生圖開放模型 SDXL，設計之初就考慮到與開放模型社區的兼容。 SDXL-Lightning 可以作為增速插件無縫整合到卡通、動漫等多樣風格的 SDXL 模型中，並支援當前流行的控制插件 ControlNet、產生軟體 ComfyUI，方便開發者、研究人員和創意從業者結合這些工具，助力整個產業的創新和協作。

此前有消息稱，在 Sora 引爆文生視頻賽道之前，字節跳動也推出了一款顛覆性視頻模型 Boximator。與 Gen-2、Pink1.0 等模型不同的是，Boximator 可以透過文字精準控制產生影片中人物或物件的動作。

對此，字節跳動相關人士回應稱，Boximator 是視頻生成領域控制對象運動的技術方法研究項目，目前還無法作為完善的產品落地，距離國外領先的視頻生成模型在畫面質量、保真率、視頻時長等方面還有很大差距。

永豐台股基金漲逾70% 投研團隊如何做到
掌握全球財經資訊點我下載APP

‌

文章標籤

字節跳動 AI 大模型生成式AI 視頻

延伸閱讀

鉅亨講座

看更多

講座
公告

下一篇
〈陸港盤後〉AI概念股推升上證指數8連陽重新站上3000點