美股

Claude 3 追上 GPT-4 來自何方神聖？

鉅亨網新聞中心2024-03-06 15:00

OpenAI 的聊天機器人 GPT-4 發布一年後，終於有了一個評測指標全面超越它的大模型。

cover image of news article — OpenAI 的 GPT-4 發布一年後，終於有了一個評測指標全面超越它的大模型。（圖：Shutterstock）

Anthropic 在周一（4 日）發布三個版本的大模型系列 Claude 3，性能由強到弱分別是：Opus （拉丁語「作品」）、Sonnet（英語「十四行詩」）及 Haiku（日語「俳句」的音譯）。

‌

Anthropic 列出的十項常用模型能力評估數據集表現，Opus 的得分全都超過 GPT-4，視覺識別能力評估數據集上的情況也一樣。

據《晚點 LatePost》報導，Anthropic 的模型趕上 GPT-4 並不只靠堆砌資源，他們本就是熟悉 OpenAI 技術路線的團隊。成立於 2021 年的 Anthropic ，早期團隊成員全部來自 OpenAI。

Anthropic 共同創始人 Dario Amodei 在 OpenAI 工作五年，離職前擔任研發副總裁，參與了 GPT-2、GPT-3 的研究。最初 OpenAI 嘗試多種方法探索人工智慧（AI）的可能性，比如遊戲、機械手，是 Amodei 和 OpenAI 首席科學家 Ilya Sutskever 一起確定了 OpenAI 專注研究大語言模型。

另一位共同創始人 Sam McCandlish，在 OpenAI 負責研究如何擴展大模型。

此外，團隊中還有負責 GPT-3 訓練基礎設施的 Tom Brown、參與數據處理的 Benjamin Mann、參與算法研究的 Nicholas Joseph 等人。

Anthropic 因此也被稱為最有可能與 OpenAI 競爭的公司。截至 2023 年底，Anthropic 從亞馬遜、Google、Salesforce 等投資者手中籌集 70 多億美元的資金，融資規模僅次於 OpenAI。

這些投資人不只為 Anthropic 提供資金，還提供稀缺的算力資源，Claude 3 就是用 AWS 和 Google 的雲端運算平台的硬體訓練出來的。

Anthropic 與 OpenAI 最大的分歧，是如何讓大模型更安全。Amodei 等人在 2020 年底離開 OpenAI，是因為不滿公司偏重盈利，降低大模型安全研究的重要性。當時 OpenAI 發布 GPT-3 的 API，加快商業化節奏。

在 Anthropic，他們的目標是開發一個「有用、誠實、無害」的大模型。

去年 7 月，《紐約時報》專欄作家 Kevin Roose 採訪 Anthropic 多位工程師，發現大多數人願意談對 AI 的恐懼，還有人因此失眠。「我感覺自己像一個美食作家，去報導一家時尚的新餐廳，但廚房工作人員只想談食物中毒。」

‌

文章標籤

OpenAI Anthropic Claude 3

延伸閱讀

鉅亨講座

看更多

講座
公告