谷歌研發通用翻譯工具:欲打破語言障礙
鉅亨網新聞中心
技術能否打破語言的障礙?Google顯然認為答案是肯定的。在一位德國電腦科學家的領導下,該公司正在研製一款世界通用的翻譯工具。微軟和臉譜也在研究類似技術。
當科幻小作家設想人類的未來時,總是有一些改進世界的點子反復出現。比如免費的用之不竭的能源、以光速旅行的宇宙飛船、還有能夠翻譯宇宙所有語言的迷你電腦。
網絡巨頭谷歌公司正試圖將最后一個夢想變成現實,負責這一項目的是一位來自德國西南部小鄉村的電腦科學家。
41歲的弗朗茲·約瑟夫·奧克長期專注於一個目標:建造完美的翻譯計算機,它是如此的低調、敏捷,“人們很容易忽略它的存在,只是聽到有一個聲音在對他/她耳語。這一裝置能夠瞬間翻譯對話或是用任何語言寫成的文本——— 比如網頁內容。
奧克擁有計算機博士學位,他的論文主題是人工智能。美國國防部高級研究計劃署(D A R PA )將他招募到加利福尼亞。2004年,奧克接到谷歌創始人之一拉裏·佩奇的電話。他問奧克:你難道不想更上一層嗎?於是奧克擁有了自己領導的部門——— 谷歌翻譯。
大膽的未來幻想是谷歌的商業模式之一,從自動駕駛汽車,到延長壽命的研究,這家網絡巨頭涉獵了多超前的領域。雖然迄今為止,谷歌翻譯似乎並沒有拿出多少成績,這可能是因為奧克和他所領導的團隊有更大的野心:他們想要打破不同語言之間的壁壘。
這位德國科學家和他的團隊已經取得了重大進展。谷歌翻譯現在可以在71種語言之間來回翻譯,比如將英語翻譯為德語;將冰島語翻譯為日語,或是反過來。
只需要將需要翻譯的文本粘貼到谷歌翻譯頁面的空白方框內,瞬間就可以將其翻譯為目標語言。只需要點擊一個按鈕就可以將義大利語的網頁翻譯成德語或其他的69種語言。你還可以用智能手機將日本地鐵站一個令人不解的標識牌拍攝下來,翻譯工具可自動識別圖片上的文字並翻譯。
去年,谷歌翻譯服務的使用次數達到2億次。迄今為止,這一服務完全免費。但多的跨國公司肯定會願意花錢購買自動翻譯服務;在未來,隨機器翻譯質量的提高,谷歌隨時可以開始收費。
現在,公司的目標還只是完善這一服務,並將它引入智能手機。翻譯小組已經開發出一款應用程序,它可將智能手機變成一款會話的翻譯機器,迄今為止,這款程序已經可以處理約24種語言。只要翻譯的語句相對簡單,這款程序的使用效果還算不錯。比如有人想要告訴一位北京的出租車司機他需要趕快去一家藥店。他只需要用自己熟悉的語言(比如德語)對手機出要求,手機立刻會用中文重覆他的意圖:“請帶我去一家藥店。”奧克覺得,目前這一程序依然“有些遲鈍、笨拙,因為還需要按按鈕。”更重要的是,翻譯的質量不太穩定。然而,就在幾年前,哪怕是現在的水平,人們也是無法想象的。
幾十年前,IBM奠定了自動翻譯的基礎,但這個項目進展遲緩,很快就被放棄。由於這個前車之鑒,谷歌翻譯啟動的第一年只是“一個純粹的研究項目”,但在近期他們取得了巨大的進展,奧克甚至稱之為“飛躍”。
翻譯小組在谷歌硅谷總部的規模在壯大,團隊成員包括多名德國電腦專家,但卻沒有一個語言學家。奧克本人也不擅長語言學。相反,他,“我學語言很艱難,這正是機器翻譯的魅力:重要的是擅長數學和統計學,會編程。”
開發字典、定義語法結構……諸如此類模擬人類翻譯的規則都和谷歌翻譯程序無關。事實上,這些語言規則大多太靈活,太不精確,導致電腦無法處理。比如在英語和德語中,形容詞位於名詞之前,而在法語中卻相反。因此如果拘泥於語法規則,翻譯軟件很快就會“迷失”。
谷歌翻譯團隊遵循自己的專長:海量數據處理和統計分析。“我們的系統所做的就是對比現有的翻譯文本,自我學習,比如某個單詞和某些詞語的組合在另一種語言中最常見的翻譯是什麼,”奧克,“最終我們計算的是翻譯的可能性。”現有參照數據越龐大,這套系統就越準確。因此,只有在互聯網出現之后,計算機翻譯才成為可能。萬維網提供了海量的現成翻譯文本。
翻譯軟件一邊收集數據,一邊學習。比如,當被要求將一句話從法語翻譯為德語,軟件先從網上搜索對應的單詞、短語,然后根據搜集到的信息計算出如何構成一個新的句子。這一方法頗為有效,但遠遠談不上完美。語法、語調和歧義依然是自動翻譯軟件面對的巨大難題。翻譯結果雖然可以理解,卻是語言學家的噩夢。機器顯然不懂得文字之美。難道需要教會軟件如何優美地遣詞造句嗎?奧克認為沒有必要。關鍵在於如何“更有效地學習。”換句話,電腦需要掌握模仿的藝術。
從翻譯程序的角度,當需要互譯的語言本身在語法和單詞結構上相似,並有大量的參照數據時,翻譯的效果通常比較令人滿意。英語和西班牙語的互譯相對完美,而英語和日語互譯則不如人意。“不幸的是,英語和德語也屬於艱難的組合,”奧克,“這尤其讓我煩惱。”
但是,谷歌最終的目的到底是什麼?它想要壟斷人類通信嗎?或是希望掌控全球交流?
奧克商業策略不在他的管轄範圍。但他表示:“機器翻譯讓很多人能夠獲得從前無法獲得的信息,這就讓其他的事情成為可能。”重要的是它們創造的間接利益。在其他品上谷歌採取相似的策略。它的搜索引擎和郵件服務目前都是免費的,但它們卻為谷歌帶來了數億的用戶和與之相關的信息。
與此同時,谷歌也面臨日益激烈的競爭。幾周前,社交網站臉譜收購了一家小公司。該公司研發了一套語言輸入和自動翻譯系統。臉譜希望這套系統可以方便不同國家用戶之間的溝通。目前這家社交網站在全球200多個國家和地區擁有超過10億用戶。
歐盟也開發了自己的自動翻譯軟件M T @EC。它主要用於翻譯官僚術語。由於金融危機導致的預算削減,在未來幾年,歐盟可能不得不裁減10%的翻譯人員。
微軟也啟動了自己的翻譯項目。去年秋天,微軟全球運營部負責人裏克·拉希德在中國的一次新聞發布會上宣佈了他們的研究成果。拉希德英語,這款微軟的翻譯器同時將他的話翻譯為普通話———不是用千篇一律的計算機聲音,而是用拉希德自己的聲音,通過他之前錄製的語音樣本組裝而成。這至少賦予了機器翻譯一點點的人性化。
- 川普關稅新政引波動 用主動式投資度過震盪
- 掌握全球財經資訊點我下載APP
文章標籤
上一篇
下一篇