menu-icon
anue logo
鉅樂部鉅亨號鉅亨買幣
search icon
A股港股

字節跳動發表文生圖開放模型SDXL-Lightning

鉅亨網新聞中心 2024-02-23 21:50

cover image of news article
字節跳動發表文生圖開放模型SDXL-Lightning(圖:shutterstock)

據陸媒《界面新聞》報導,字節發表文生圖開放模型 SDXL-Lightning。AI 開源社群 Hugging Face 的最新名單,SDXL-Lightning 躋身模型趨勢榜,同時也成為 Hugging Face Spaces 上的熱門模型。

報導稱,與 SDXL-Lightning 一同上榜的,是 Google 新推出的「最強開放大模型」Gemma 系列,以及 Stability AI 的新一代文生圖模型 Stable Cascade。

在影像生成領域,先進模型的生成技術依賴擴散過程,就是把雜訊逐步轉換為影像樣本的迭代。 這個過程通常需要 20 到 40 次呼叫神經網絡,不僅會耗費龐大的運算資源,生成速度也比較慢。 產生一張高品質影像,大約需要 5 秒。

知情人士透露,字節跳動的 SDXL-Lightning 透過漸進式對抗蒸餾的技術,實現前所未有的生成速度。 此模型能夠在 2 步或 4 步內產生極高品質和解析度的影像,將產生速度加快十倍,是 1024 解析度下速度最快的文生圖模型,計算成本則降低為十分之一。

字節跳動智慧創作團隊對回應稱,開源開放的浪潮已成為推動人工智慧快速發展的關鍵力量,SDXL-Lightning 模型基於已有繁榮生態的文生圖開放模型 SDXL,設計之初就考慮到與開放模型 社區的兼容。 SDXL-Lightning 可以作為增速插件無縫整合到卡通、動漫等多樣風格的 SDXL 模型中,並支援當前流行的控制插件 ControlNet、產生軟體 ComfyUI,方便開發者、研究人員和創意從業者結合這些工具 ,助力整個產業的創新和協作。

此前有消息稱,在 Sora 引爆文生視頻賽道之前,字節跳動也推出了一款顛覆性視頻模型 Boximator。 與 Gen-2、Pink1.0 等模型不同的是,Boximator 可以透過文字精準控制產生影片中人物或物件的動作。

對此,字節跳動相關人士回應稱,Boximator 是視頻生成領域控制對象運動的技術方法研究項目,目前還無法作為完善的產品落地,距離國外領先的視頻生成模型在畫面質量、保真率、視頻 時長等方面還有很大差距。






Empty