大模型
美國周一 (13 日) 宣布將進一步限制 AI 晶片和技術的出口,將先進算力留在美國及其盟友手中,並尋找更多方法阻止中國取得這些技術,而在兩天後,中國 5 家 AI 公司周三 (15 日) 發佈大模型新品和相關技術進展來進行回應。中國 AI 上市公司科大訊飛 (002230-CN) 周三推出國產深度推理大模型「訊飛星火 X1」,這是科大訊飛與華為聯手訓練出的中國首個基於全國產算力的具備深度思考和推理能力的大模型,對標 OpenAI o1 系列,中文數學能力國內第一,並率先應用於教育、醫療等剛需場景。
近來在中國相當熱門的大模型 DeepSeek,終於在蘋果 App Store 上架應用程式「DeepSeek」,這款由 DeepSeek V3 模型支援的應用程式結合深度思考和聯網搜索兩大核心功能,支援使用者完成對話、語言翻譯、創意寫作、程式設計、解題、文獻解讀、旅行規劃等用途,相當於說是網頁版的各種功能都支援。
科技
大模型創業公司零一萬物創辦人李開復最新表示,大模型公司今年將迎來商業模式的「靈魂拷問」,這位創新工廠董事長兼執行長並以 5 點總結 2024 年中國大模型產業發展,第一是行業瞬息萬變,其次是 Scaling Law 效能放緩,第三是模型推理成本大降,第四是國內 to C 太卷了,最後是國內 to B 有希望。
科技
據陸媒《21 世紀經濟報導》,近日,量化巨擘幻方量化的子公司深度求索(DeepSeek)發表了全新系列模型 DeepSeek-V3,並同步開源,在 AI 圈引發熱議。有評論稱,DeepSeek-V3 不僅霸榜開源模型,更在效能上與全球頂尖閉源模型 GPT-4o 和 Claude-3.5-Sonnet 不相上下。
國際政經
中國 AI 創新公司 DeepSeek 日前發表開源全新 DeepSeek-V3 模型,耗時僅兩個月、訓練成本不到 600 萬美元,就足以與 ChatGPT 一較高下,撼動全球 AI 界。而中國這項技術的躍進,可能是川普第一任期對中國進行「晶片封鎖」下的產物。
科技
中國《界面新聞》周四 (26 日) 引述知情人士消息獨家報導,小米集團(01810-HK) 正搭建 GPU 萬卡集群,大力投入 AI 大模型,該公司雖未發表看法,但知情人士稱該計畫已施行數月,由雷軍領導。此前,DeepSeek-V2 關鍵開發者羅福莉將加入小米領導大模型團隊。
科技
智慧眼鏡正成為 AI 技術落地應用的重要設備,中國手機大廠小米 (01810-HK) 與互聯網業者百度 (09888-HK)(BIDU-US) 近來也加入 AI 眼鏡的競爭行列,在百度上周二 (13 日) 發佈小度 AI 眼鏡後隔天,小米也傳出正計畫推出新一代 AI 眼鏡。
大陸政經
《澎湃新聞》周一(28 日)揭露,字節跳動準備在歐洲設立人工智慧(AI)研發中心,已開始在歐洲積極招募 LLM(大語言模型)和 AI 領域的頂尖技術人才,加強在全球第二大經濟體中的 AI 研發能力。今年 9 月初就有媒體報導,字節跳動董事會加入一位歐洲新董事,即法國富商尼爾(Xavier Niel),拓展歐洲市場的意圖明顯。
科技
Meta 首席科學家 Yann LeCun(楊立昆)近日發表多篇演講,分享他對人工智慧未來的深刻見解。作為深度學習領域的先驅者和 2018 年圖靈獎得主,LeCun 的觀點引發了廣泛關注。他近日的演講內容,主要圍繞 AI 的需求與現狀,現有 AI 的局限性,開源 AI 平台的必要性以及通往人類水準的 AI 道路等多個方面。
科技
AI 獨角獸「零一萬物」創辦人、前 Google 中國總裁李開復表示,相較於美國的 AI 巨擘,中國 AI 的優勢在於製造真正實惠的推理引擎,這是 AI 應用蓬勃發展、商業落地最重要的事。零一萬物新推出的新旗艦預訓練模式 Yi-Lightning,在國際權威盲測榜單 LMSYS 上超越 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中國第一。
科技
Nvidia (NVDA-US) 研究人員提出了一種新穎的神經網路架構,稱為歸一化 Transformer (nGPT)。研究人員表示,在 nGPT 中,單位範數對所有向量進行歸一化,包括嵌入、多層感知器 (MLP)、注意力矩陣和隱藏狀態。在這一架構中,輸入標記在超球體 (hypersphere) 的表面移動,每一層都為輸出預測貢獻一個位移。
科技
在當今的科技討論中,人工智慧的快速發展常常伴隨著對其潛在威脅的擔憂。然而,Meta(META-US) 的首席科學家 Yann LeCun 在最近的發言中,對這類言論嗤之以鼻。LeCun 表示,事實是,人工智慧不可能輕易超越人類水準的智力,並對人類構成危險—他稱這一說法「完全是胡說八道」。
美股雷達
隨著 Meta 平台 (META-US) 的股價持續攀升,其執行長查克柏格 (Mark Zuckerberg) 在 3 日首次成為全球第二大富豪,超越亞馬遜 (AMZN-US) 創辦人貝佐斯 (Jeff Bezos)。根據彭博億萬富翁指數,當地時間 10 月 3 日,查克柏格淨資產達到 2,062 億美元,比貝佐斯高出 11 億美元,但仍落後於特斯拉 (TSLA-US) 執行馬斯克 (Elon Musk) 的近 500 億美元。
科技
2024 年外灘大會今 (5) 日在上海開幕,本屆大會延續「科技 · 創造可持續未來」主題聚焦 AI 產業新實踐、科技人文新思考、金融科技新探索三大方向,討論與分享 AI 時代下的挑戰與機遇。《新浪財經》報導,今年外灘大會延續高規格嘉賓陣容,外籍參會嘉賓數量創新高,邀請到 10 餘位享有盛譽的中外院士,以及 500 多位產業領軍人物作為演講嘉賓,探討科技趨勢與產業的深度融合,其中包括中國科學院院士、復旦大學校長金力,中國工程院院士、阿里雲創始人王堅以及「機器學習之父」、美國三院院士 Michael I. Jordan 以及香港科技大學校董會主席、美國國家工程院外籍院士沈向洋等人。
A股港股
百度 (09888-HK)(BIDU-US) 創辦人、董事長兼執行長李彥宏在財報電話會議上披露,文心大模型日均調用量超過 6 億次,日均處理 Tokens 文本約 1 兆,均為大陸最高。比起 2023 年第四季公布 5000 萬次日均調用量,半年成長超過 10 倍。
大陸政經
2024 世界人工智慧大會 (WAIC) 暨人工智慧全球治理高級別會議今 (4) 日在中國上海舉行,大會主題是「以共商促共用 以善治促善智」,包括 9 位圖靈獎、菲爾茲獎、諾貝爾獎得主和 88 位國內外院士等 200 位重磅嘉賓參加,逾千位全球產業領軍人物也將與會。
美股雷達
針對日前市場傳出即將進軍手機市場的消息,TikTok 母公司字節跳動週三 (12 日) 否認,並稱只是在探索基於手機的大模型軟體解決方案,提供給手機廠商參考使用。目前並沒有製造手機並銷售的計畫中國創投媒體《鉛筆道》報導,字節跳動早就有手機業務,早在 2019 年就收購鎚子手機,當初目的是要探索教育硬體。
阿里雲 5 月 9 日召開高峰會,正式發表「通義千問 2.5」,並開源通義千問 1100 億參數模型。阿里雲聲稱,模型效能全面追趕 GPT-4-Turbo,成為「地表最強」中文大模型。在高峰會當日,原通義千問 APP 宣布更名為「通義 APP」,將通義大模型全套能力集於一身,致力於成為 “通情達義” 的 AI 助手。
A股港股
針對創辦人楊植麟透過售出個人持股「套現數千萬美元」的消息,月之暗面方面回應稱,上述消息不實,月之暗面此前已公布員工激勵計劃。根據月之暗面官方公眾號 3 月 11 日發布的消息,從 2024 年開始,該公司將在取得重要進展時發起員工期權回購計劃,確保團隊成員能夠分享公司發展的果實(2024 年底啟動首次選擇權回購計劃)。
科技
李飛飛領導的史丹佛大學以人為本人工智慧研究院(HAI),近日發布 2024 年度《人工智慧指數報告》,並總結 2023 人工智慧發展 10 大趨勢。總結的 2023 人工智慧發展 10 大趨勢是:1. 人工智慧在某些任務上勝過人類,但並非在所有任務上。