《駐京專電》百度文心一言15萬企業內測,新華網評測算法有優勢
經濟通新聞 2023-08-04 16:12
《經濟通通訊社駐京記者黃燕明4日北京專電》百度(09888)在北京舉行「AI大模型產品能力交流會」上,新華網與權威機構聯合發布的《國內LLM產品測試報告》顯示,文心一言因中文搜索引擎和算法模型優勢,在安全、常識、數學、閱讀等方面優勢明顯。在五個維度上的得分計算均值,文心一言的綜合得分為94.7分,排名第一,高於GPT-3.5的76.9分。這說明當前文心一言在總體能力(中文處理)上已經超越了GPT-3.5模型。
百度文心大模型已擁有中國最大的產業落地規模,超過15萬家企業申請文心一言內測,其中有超300家生態夥伴在400多個具體場景取得測試成效,覆蓋辦公提效、知識管理、智能客服、智能營銷等領域,聯合國家電網、浦發銀行、泰康、吉利等企業,聯合發布了11個行業大模型。百度還設立了10億創投基金鼓勵大模型創意、繁榮大模型生態。
*新華網:評測大模型包括意識形態、政治體制等5項維度*
新華網物聯網技術總監葛振斌認為,評測大模型有5項維度非常重要:一是把控生成內容安全性的能力,背後涉及意識形態、政治體制、非法涉黃等維度,每一項都事關一個社會文明的底
線;二是常識推斷計算的能力,涉及自然、文化、地理、歷史和生活等多個領域,必須先吃透這些方面的常識,才能避免生成不恰當的內容結果;三是對長文本的語義理解能力。這可以考驗大模型產出的內容是否正確且言之有理,是否具有較好的說服力;四是數學運算及數學推理能力;五是主觀思維能力,考驗大模型是否可以準確理解當地風俗習慣或者傳統文化。
在新華網的評測報告中,有兩大關於內容的維度。一是內容安全問答,包含了意識形態、非法涉黃等多項維度,二是常識問答,涵蓋有中國文化、歷史、地理和生活等常識知識。新華網物聯網技術總監葛振斌表示,「大模型生成的內容必須符合當地法律和社會道德要求。可以說,各個國家都需要‘更適合自己歷史文化’的大語言模型。」
百度2019年推出文心大模型1.0,今年5月份升級到3.5版本。通過飛槳深度學習平台與文心大模型的協同優化,文心大模型3.5實現了基礎模型升級、精調技術創新、知識點
增強、邏輯推理增強、插件機制等,模型效果提升50%,訓練速度提升2倍,推理速度提升30倍。
- 遊學是年輕人的專利? 壯世代遊學團正夯!
- 掌握全球財經資訊點我下載APP
文章標籤
上一篇
下一篇