menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

美股

微軟CEO納德拉評DeepSeek:令人印象深刻 運算效率非常高

鉅亨網編譯鍾詠翔 2025-01-28 15:00

cover image of news article
微軟CEO納德拉說,DeepSeek令人印象深刻,運算效率非常高。(圖:Shutterstock)

據《CNBC》上周五(24 日)報導,微軟 (MSFT-US) 執行長納德拉在瑞士達沃斯世界經濟論壇上表示:「DeepSeek 新模型令人印象深刻,尤其是在如何高效開發開源模型並進行推理運算方面,它的運算效率非常出色。我們應當非常、非常認真地看待中國這些技術的進展。」

Meta 首席 AI 科學家、圖靈獎得主 Yann LeCun 表示,DeepSeek 的成功,並不應該被看作中國人工智慧(AI)超越了美國,應看作開源模型正在超越專有模型。


LeCun 寫道:「DeepSeek 受益於開放研究和開源…... 他們提出了新的想法,並在其他人的工作基礎上建構了這些想法。他們的工作公開和開源,每個人都可以從中受益。」

近期 DeepSeek-R1 躋身大模型競技榜前三,以開源、便宜 20 倍的身價與 ChatGPT-4o(2024.11.20)並列。

本月亦有消息稱臉書母公司 Meta 成立了四個專門研究小組研究 DeepSeek 的工作原理,並以此改進旗下大模型 Llama。

1 月 20 日,DeepSeek-R1 推理大模型正式發布。DeepSeek-R1 在後訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1 正式版。

不僅如此,Deepseek 已登頂蘋果中國地區和美國地區應用商店免費應用程式(App)下載排行榜,在美國地區下載榜上超越了 ChatGPT。

在社交平台 X 上,DeepSeek 已經成為熱門話題。日前一位科技愛好者在 X 發布一篇貼文名為「再見 ChatGPT!」的貼文,直言 DeepSeek 最新模型才發布五天,世界已經被其潛力震驚。這篇貼文獲得了超過 8,000 個轉發和超過 5 萬點讚。

文章標籤


Empty