視覺語言模型
美股雷達
輝達、南京大學、香港理工大學及羅格斯大學團隊合作推出一項最新成果「Eagle 2.5」,這是一種用於長上下文多模態學習的視覺語言模型(VLM),為現有 VLM 打破局限性提供了一個創新解決方案。為了應對業界中長視訊理解和高解析度影像理解方面的挑戰,輝達團隊引入了適用於這兩項任務的一種通用框架,該框架還在長情境資料訓練的流程中納入了多項效率優化措施。
2025-04-23
美股雷達
輝達、南京大學、香港理工大學及羅格斯大學團隊合作推出一項最新成果「Eagle 2.5」,這是一種用於長上下文多模態學習的視覺語言模型(VLM),為現有 VLM 打破局限性提供了一個創新解決方案。為了應對業界中長視訊理解和高解析度影像理解方面的挑戰,輝達團隊引入了適用於這兩項任務的一種通用框架,該框架還在長情境資料訓練的流程中納入了多項效率優化措施。