《AI熱潮》DeepSeek技術強成本廉,概念A股異軍突起
經濟通新聞 2025-01-27 10:30
《經濟通通訊社27日專訊》A股人工智能(AI)大模型DeepSeek概念今日異軍突起,浙江東方(600120-CN)、華金資本(000532-CN)、每日互動(300766-CN)、航錦科技(000818-CN)、南威軟件(603636-CN)等漲停,飛利信(300287-CN)漲10%;浪潮信息(000977-CN)、中科曙光(603019-CN)約升5%。
脫胎於內地私募巨頭幻方量化(High-Flyer)的開源模型初創公司DeepSeek上周一(20日)發布推理大模型「R1」,並同步開源模型權重,以促進技術社區的交流與創新協作。R1在後訓練階段大規模使用強化學習技術,能在僅有極少標註數據的情況下,極大提升模型推理能力。
與頂尖推理模型、OpenAI推出的o1並列。同時,測評機構Artificial-Analysis對DeepSeek-R1的初始基準測試結果也顯示,DeepSeek-R1在AI分析質量指數中取得第二高分,價格則是o1的約30分之1。
不到一個月前,DeepSeek才剛在去年12月26日發布DeepSeek-V3大模型,性能比肩GPT-4o,投入研發費用僅為558萬美元,訓練成本不到GPT-4o的二十分一,且只用了2048張H100的GPU集群,用時僅53天。在同等水平下,即使是全球AI第一梯隊的頭部公司,至少也要用到1.6萬張以上的GPU進行訓練。
*DeepSeek登蘋果中國區、美國區免費App下載第一位*
接連發布兩款強大而成本低廉的大模型,使得DeepSeek迅速引發海內外市場熱烈討論。DeepSeek應用在1月27日登頂蘋果中國地區和美國地區應用商店免費App下載
排行榜,在美區下載榜上超越了ChatGPT。有評論認為,R1的快速發布表明中國在AI領域的追趕速度加快,也令市場對中美AI競爭格局重新評估,尤其是在計算資源和模型效率方面。
此前AMD宣布,已將新的DeepSeek-V3模型集成到Instinct MI300X GPU上,該模型旨在與SGLang一起實現最佳性能。此外,Meta生成AI小組和基礎設施團隊的經理和工程師已開設了4個作戰室來學習DeepSeek的工作原理,包括在試圖了解High-Flyer如何降低訓練和運行DeepSeek的成本、High-Flyer可能使用哪些數據來訓練其模型,以及正在考慮基於DeepSeek模型屬性重構Meta模型的新技術。
*創辦人梁文鋒上周參加總理座談會並發言*
天眼查顯示,DeepSeek的開發者杭州深度求索人工智能基礎技術研究有限公司成立於2023年7月,由寧波程恩企業管理諮詢合夥企業(有限合夥)和幻方量化聯合創辦人梁文鋒共同持股。
「80後」梁文鋒本科、研究生均就讀於浙江大學,擁有信息與電子工程學系本科和碩士學位。2008年起,梁文鋒就開始帶領團隊使用機器學習等技術探索全自動量化交易。2015
年,幻方量化正式成立,2019年,其資金管理規模突破百億元。2016年10月21日,幻方量化推出第一個AI模型,第一份由深度學習生成的交易倉位上線執行,使用GPU進行計算。2017年,幻方量化宣稱實現投資策略全面AI化。2018年,幻方量化確立以AI為公司的主要發展方向。2023年7月,幻方量化宣布成立大模型公司DeepSeek,正式進軍通用人工智能領域。
官媒《新華社》此前報道,國務院總理李強上周一(20日)主持召開專家、企業家和教科文衛體等領域代表座談會,聽取對《政府工作報告(徵求意見稿)》的意見建議,梁文鋒是座上賓之一,並且有發言,但報道未提及梁文鋒的發言內容。(sl)
- 最新遺產稅怎麼算?傳承必知重點有哪些?
- 掌握全球財經資訊點我下載APP
文章標籤
上一篇
下一篇