menu-icon
anue logo
澳洲房產鉅亨號鉅亨買幣
search icon

生活

中文語音辨識軟體大難題─媽媽騎馬 馬慢 媽媽罵馬

鉅亨網編譯許家華 綜合外電 2012-03-20 18:00


Dragon軟體已可大略辨識基本的中文語音
Dragon軟體已可大略辨識基本的中文語音

彭博《Businessweek》聯合編輯 Venessa Wong 發表了一篇討論中文語音辨識軟體的文章:


在期盼 Apple (蘋果) (AAPL-US) 今年推出中文版 Siri 的心情下,我決定去試試 Nuance Communications (NUAN-US) 的智慧手機語音辨識 app─Dragon 軟體,Siri 的語音辨識技術便是由該公司支援。該公司的語音辨識技術擁有許多語言,其中也包括中文。

基本上,Dragon 的中文版可令人相當驚艷,但如同多數語音辨識軟體一樣,該軟體也不會百分百正確。

首先,有一點是中文何以對語音辨識軟體充滿挑戰的原因:中文僅約有 400 個單音節子音,由四聲區別各自差異。什麼意思?

舉例而言,「媽」、「罵」、「馬」這幾個字,全都聽起來類似,差別僅在聲調不同,若要研發出一套可以分辨出「媽媽罵馬」這種句子的軟體,顯然不是件簡單的任務。

雖然中文 (Mandarin) 是中國的官方語言,但該國卻有7種語言團體、許多種方言,還有數不清的各地腔調。Nuance 的 Dragon 研究單位副總裁 Jim Wu 表示:「中國大陸內,每個人都有各自的腔調,其中一項挑戰就是要確保這個系統可以判讀帶有一點腔調的中文。」

Nuance 在 2011 財年營收達 14 億美元,該公司在推出英文版辨識軟體不久,去年 3 月就推出兩款免費的中文 app,6 月份又追加粵語版和台灣版。Dragon Dictation 軟體可翻譯文件、電子郵件、Facebook 和推特內文。Dragon Search 則用於網路搜尋,但不同於蘋果 Siri的一點是─Dragon 不會和使用者對話。

Nuance 行銷長 Peter Mahoney 表示,使用該 app 時,使用者按下虛擬按鍵以啟動和停止錄音,所有處理過程均由伺服器掌握,因此聽寫任務直接串流至伺服器,在該處進行聽取、錄音和回傳文字至設備的工作。

我試著說了一些基本句子,例如「最近的星巴克在哪?」和「我要去市場」,這些不會有什麼問題,但對多數使用者來說,真的有趣的地方就是在於測驗這個設備的辨識極限,看看科技到底能掌握人類語言和思考到什麼程度。

所以我用中文繞口句子測試看看:「媽媽騎馬,馬慢,媽媽罵馬」。

結果,Dragon 大致上抓對了音調,但卻沒選到正確的字,出現的句子變成:「媽媽起碼,媽媽,媽媽媽嗎?」

雖然不是百分百正確,但 Dragon 軟體有自學改進功能。Mahoney 表示,因為所有處理過程都在伺服器上,因此 Dragon 會搜集使用者的說話數據,以學習這種語言和語詞配對習慣,也會逐漸習慣每位使用者的地方腔調,因此使用次數越多,正確性就越高。

Mahoney 補充:「我們保存這些錄音,我們可分析使用自動工具的結果,有時你會讓人使用錄音,來看看他們是否可以做得更好。」

文章標籤


Empty