menu-icon
anue logo
馬來西亞房產鉅亨號鉅亨買幣
search icon


快訊

OpenAI發布更新,實現即時跨音訊、視覺和文字推理

BlockBeats 律動財經


BlockBeats 訊息,10 月 2 日,據 Cointelegraph 報道,OpenAI 在 10 月對其模型進行了四項更新,幫助其 AI 模型更好地進行對話並提高圖像識別能力。第一項重大更新是即時 API,它允許開發人員使用單一提示創建人工智慧生成的語音應用程序,實現類似於 ChatGPT 高級語音模式的自然對話。以前開發人員必須將多個模型「拼接在一起」才能創造這些體驗。音訊輸入通常需要在接收回應之前完全上傳和處理,這意味著語音相互對話等即時應用程式的延遲較高。借助 Realtime API 的串流功能,開發人員現在可以實現即時、自然的交互,就像語音助理一樣。該 API 運行在 2024 年 5 月發布的 GPT-4 上,可即時跨音訊、視覺和文字進行推理。


另一項更新包括為開發人員提供的微調工具,使他們能夠改進從圖像和文字輸入生成的人工智慧回應。基於影像的微調器使人工智慧能夠更好地理解影像,從而增強視覺搜尋和物體偵測能力。這個過程包括來自人類的回饋,他們提供了好的和壞的反應例子進行訓練。



除了語音和視覺更新之外,OpenAI 還推出了“模型蒸餾”和“提示緩存”,允許較小的模型向較大的模型學習,並透過重複使用已處理的文字來減少開發成本和時間。根據路透社報道,OpenAI 預計明年營收將增至 116 億美元,高於 2024 年預計的 37 億美元。

原文連結

暢行幣圈交易全攻略,專家駐群實戰交流

▌立即加入鉅亨買幣實戰交流 LINE 社群(點此入群
不管是新手發問,還是老手交流,只要你想參與加密貨幣現貨交易、合約跟單、合約網格、量化交易、理財產品的投資,都歡迎入群討論學習!

前往鉅亨買幣找交易所優惠

文章標籤



Empty