menu-icon
anue logo
澳洲房產鉅亨號鉅亨買幣
search icon

科技

人工智能中轉站:人機語音交互

鉅亨網新聞中心 2015-12-22 08:15


吳豐恆

智能語音交互對人們生活的影響正在潛移默化地發生。


以前,人們還習慣於通過鍵盤和觸控屏操控智能設備,而三到五年內,科學家認為人們或許可以隨時給身邊智能設備、機器人下達指令,幫助訂餐、訂票,乃至端茶遞水。

過去,機器對語音識別度不高,對自然語言的語義更難以理解,阻礙了語音交互的應用。

但僅僅在一兩年內,隨降噪技術、方言識別、“雙工多輪交互”技術、機器學習技術的發展、對語音的準確識別,乃至對語義的準確理解,讓機器準確理解並執行人類指令成為可能。

“以語音和語言為入口的認知革命,將推動人工智能夢想成真。這是一條人工智能走認知計算的必由之路。”由科大訊飛研發的最新技術,實時文字同傳了科大訊飛董事長劉慶峰的演講。

“(原來)我問一次北京明天天氣,然后可以再問上海明天天氣。而現在我可以問北京明天天氣,然后直接問‘上海的呢?’,它馬上就知道上下文相關。”劉慶峰。

同時,在機器回答問題時,人類今后也可以隨時打斷,插入新的指令和話題。

方言、環境噪音,都可能影響語音識別準確度,而劉慶峰表示,最新的科技,結合了方言、降噪、“雙工多輪”等技術,2015年將語音識別準確度由40%已提升至90%。

讓機器執行人類語音指令,識別是首要前提,但接下來另一個重要課題是如何讓機器理解自然語言語義,而這也涉及更深層次“人工智能”。

過去60年中,人工智能掀起過兩波浪潮,從證明數學原理,到大規模神經網絡出現。直到2006年,機器“深度學習”正式提出,並被證明可用於大規模神經網絡的學習訓練,海量的數據給予機器學習資源,卷積神經網絡、遞歸神經網絡等機器學習技術,在語音交互方面逐步獲得應用。

“我們認為,人工智能發展有一條必由之路,就是以語音和語言為入口的認知智能的革命。這是我們今天所面臨的機會,也是我們已經找到的路徑。”劉慶峰。

隨語音識別技術發展,演講者現場發言時語音同步轉錄為文字實時顯示,已經可以保證高準確度。這項技術將可能應用於教育、文化娛樂等多個領域。例如,學生將可以實時獲得並保存教師講課的文字內容,而專門從事語音文字轉錄的速記行業將發生改變,秘書和文字工作者的工作分量可減輕。

不過,機器在合成、識別很多方面達到人工水平是感知智能的發展,最有挑戰性的是認知智能。

怎樣突破認知智能?劉慶峰認為,應當回到人類進化的原點,“各方面的證據匯在一起,語言使得我們能夠反饋周邊環境信息,才使得我們可以虛構概念,可以有理想、有主義,可以有組織。”

認知智能有三個核心能力:交互、知識管理、學習和推理方面。學習、推理能力的發展成功已經應用到電信、金融、教育等行業。

在電信行業,智能語音客服已經可以代替三大運營商30%的人工客服。

在教育行業,美國、日本和中國都推出了“機器高考”項目。其中美國的目標是讓計算機未來通過美國生物學大學入門考試,日本的目標是讓機器人2021年能夠考上東京大學,中國的人工智能計劃,也是讓類人答題機器人3到5年內能夠考上一本大學,這意味,在未來中國100個大學生中,機器要考入前20,其不僅需具備較強的記憶能力,還必須具備表達、推理、學習能力。

機器學習在教育行業的發展誕生了智能閱卷,而通過智能閱卷,可以分析出學生學習的薄弱環節,“有了這些技術,我們就可以給孩子有針對性的學習推薦,使個性化學習真的成為可能。”劉慶峰。

“人工智能一定是為人類服務的,是用來延展我們人類的能力的。隨萬物互聯時代的語音、語言交互,使得我們的智慧可以在后台進行碰撞比對,相互發獲得靈感,我們人類的群體智慧會上一個巨大台階。那個時候不是奇點臨近,不是人類末日的到來,而是人類一個全新時代的開始。”劉慶峰。

文章標籤


Empty