A股港股

《AI熱潮》豆包推出實時語音大模型,語氣情緒優於GPT-4o

經濟通新聞2025-01-21 11:57

　　《經濟通通訊社21日專訊》字節跳動旗下豆包大模型團隊昨日正式推出豆包實時語音大模型,並在豆包App(7.2.0　新春版本)全量開放,賦予所有用戶與AI進行實時對話的能力。豆包方面還引述一些外部用戶反饋稱,這款產品的整體滿意度較OpenAI旗下的GPT-4o有「明顯優勢」,特別是語音語氣自然度和情緒飽滿度遠高於後者。

　　據豆包團隊介紹,豆包實時語音大模型是一款語音理解和生成一體化的模型,相比傳統級聯模式,在語音表現力、控制力、情緒承接方面表現驚艷,並具備低時延、對話中可隨時打斷等特性。

‌

*比GPT-4o搶先實現唱歌和角色扮演*

　　豆包團隊又指,該模型的推出具備里程碑式意義,不僅貼合中國用戶實際需求,且發布即上線,有能力直接服務億萬用戶,而非停留於演示Demo層面。在端到端語音能力加持下,不僅是春節探親歡聚的神隊友,還是獻唱「恭喜發財」的高情商歌手。

　　據內地科技媒體測試,豆包上新的「靈魂歌手」和「百變大咖」等語音通話模式,比GPT-4o搶先一步實現了唱歌和角色扮演。例如提出「模仿虞書欣的聲音說話,並且說一段新年祝

福」,豆包一句「哼,我才不要模仿她呢!我就是我,不一樣的煙火」,就把虞書欣「小作精」的特色還原出來。

　　有分析認為,字節跳動在農曆新年前夕發布這款產品,目標或是為了借助這一傳統節日進一步快速獲客。對於互聯網公司來說,農曆新年假期意味著更高的用戶活躍度和更大的流量,是推廣新產品或服務的好時機。(sl)

‌