menu-icon
anue logo
澳洲房產鉅亨號鉅亨買幣
search icon

期貨

谷歌翻譯將升級:實時聽譯並轉為文字

鉅亨網新聞中心 2015-01-12 10:17


導語:《紐約時報》網絡版周日刊文稱,Skype近期開始測試英語和西班牙語之間的實時語音翻譯,而谷歌也將對翻譯應用進行升級。這表明,全球主要科技公司仍在繼續嘗試消除人們之間溝通的主要障礙,並已經取得了不錯的成果。

以下為文章全文:


科技行業正在竭盡全力推翻阻礙全球之間相互交流的“巴別塔”。

上月,微軟旗下視頻通話服務Skype開始在英語和西班牙語用戶之間測試實時翻譯功能。預計不久之后,谷歌也將發布翻譯應用的升級。谷歌翻譯的文字版目前提供了90種語言的翻譯,並且已經能對少數幾種常用語言進行聽譯。在此次升級之后,這款應用能自動識別用戶是否在講某種常用語言,並將其自動轉為文字。

這種將某一語言翻譯為另一語言的技術可能效果並不是很好。在使用該服務時,用戶需要佩戴頭戴式耳機,而只有當話者停下來靜聽對方正在說什麼時,才能發揮最好的效果。整個體驗就像是兩名電話銷售員在使用對講機。

不過,在使用過程中,這樣的抱怨將會被“奇跡”帶來的震驚所取代。在幾分鐘時間裏,我就習慣了這一流程,並與一名哥倫比亞人自由地討論他在麥德林的妻子、孩子和生活。Skype最開始曾將麥德林聽成了“Made A”,但隨后做出了修正。雙方溝通的最大障礙,即語言的差異,正在消失。

對語言的改進已經成為在品優化的關鍵一部分。這些服務利用了機器學習算法,使計算機不斷檢查結果,並做出相應的調整。這將使在拼寫檢查變得更加可靠,同時使搜索、地圖導航,以及其他在服務越來越好。

我那位來自哥倫比亞的朋友塞巴斯蒂安·庫伯羅斯(Sebastian Cuberros)在Skype上表示:“在你對話的過程中,程序在進行學習。目前,這已經很不錯。”盡管語法並不完美,但你能知道對方在的是什麼意思。

目前,只有幾千名用戶在Skype上使用該功能,而這一功能將從他們身上進行學習。此外,還有近4萬名用戶正在等待嘗試這一西班牙語和英語之間的翻譯服務。即使仍處於開發早期,但這帶來了許多的可能性,例如讓美國和墨西哥的兒童共同參加社會學習課程,或是對生活在敘利亞的家庭進行實時訪談。

谷歌表示,其翻譯應用已被安裝在Android手機上超過1億次,而其中大部分都將收到谷歌推送的升級。“每月,在所有平台上,我們的翻譯服務擁有5億活躍用戶。”谷歌翻譯工程主管邁克杜夫·休斯(Macduff Hughes)表示。由於全球80%至90%的網頁都只採用約10種語言,因此翻譯已成為了許多人進行學習的關鍵一部分。

谷歌Chrome瀏覽器已經提供了一項功能,將網頁自動翻譯為某種主要語言。Chrome瀏覽器的用戶可以將一個英文頁面直接轉換為韓文等其他語言。此外,Gmail設置等頁面支持在約140種語言之間切換。

用戶可以將自己的電子郵件語言設置為克林貢語、海盜語和艾瑪語等搞怪的語言。其他一些小語言,例如切諾基語,並不是為了搞笑,而谷歌已實現了對這些語言的全面翻譯。谷歌還將發布一款服務,在用戶拿起手機對準國外街道上的標誌時,就能在屏幕上看到實時的翻譯結果。

微軟的必應翻譯引擎被用於了Twitter和Facebook。Facebook運營全球最大的照片分享服務,涉及了多種語言。為此,該公司也在開發翻譯服務。此外,Skype的數千名用戶已注冊排隊,等待其他同步翻譯服務的推出,這些翻譯服務包括了漢語和俄語。

給“語料庫”加入更多數據對某些語言來非常重要,而對機器學習算法的優化也是如此。谷歌翻譯最初的語料庫數據來自人工翻譯。谷歌近期開始支持哈薩克語,而一名政府官員近期在電視機上呼籲人們給予幫助。休斯表示:“人們有非常強烈的呼聲,要求我們將他們的語言納入到服務中。”

不過,一些專家仍然擔心,機器可能會深入學習語言的其他部分,例如聲調和幽默感。與搜索關鍵詞和Facebook“點贊”記錄類似,這些信息是否會被廣告主和司法部門所利用?

從事未來通信技術研究的Hypervoice Consortium聯合創始人凱利·菲茲西蒙斯(Kelly Fitzsimmons)表示:“技術可能擁有魔力,但帶來的威脅也真實存在。如果政權發生更替,而新政府不喜歡人們所的話,那麼這時語料庫信息意味什麼?”

菲茲西蒙斯表示,目前,只有不到1%的用戶願意讓他們的數據被記錄。這可能是由於用戶願意幫助機器學習翻譯,也可能發生在他們使用Siri等語音助手服務的過程中。她認為,個人用戶將越來越擅長管理自己的個人隱私,而不是將隱私保護的責任都交給服務提供商。不過從目前來看,用戶更看重便利性。

Skype這一項目的品營銷負責人奧利弗·馮塔納(Olivier Fontana)表示,在檢查翻譯質量之前,會話已被分成了多個不同檔案。他表示:“沒有辦法知道,什麼人過一些什麼。美國國家安全局無法從中獲得有用的信息。”

休斯則表示,谷歌對於語音記錄非常謹慎。這部分是由於,隨語音等生物信息安全方式取代傳統的密碼,這可能會帶來潛在的問題。除此之外,應當採取一些方式,讓翻譯語音與普通語音有所區別。例如,如果用戶漢語,那麼可以採用一種女性的聲音,使人們知道這是翻譯的內容。(張帆)

文章標籤


Empty