科技

明斯基：差點將AI扼殺在搖籃裏的人工智能之父

鉅亨網新聞中心2016-01-27 14:01

新浪科技維金

1月24日，在波士頓去世的馬文·明斯基(Marvin Minsky)的身后，有一長排讓人肅然起敬的稱號：人工智能之父、世界上首個人工智能實驗室——麻省理工學院人工智能實驗室的聯合創始人、計算機領域頂級獎項圖靈的獲得者、虛擬現實先驅等等等等。但明斯基最重要的遺，是神經網絡技術。沒有明斯基，今天大部分的科技應用，或許和你根本無緣。

‌

舉例來，當你使用語音助手查詢天氣、進行語音輸入時，用搜索引擎去搜索某張圖片時，和朋友聊天使用實時翻譯服務時，你可能不會注意到，這些工具背后的一個共同點：深度學習技術。過去幾年，深度學習，以及作為其基礎的人工神經網絡正在快速發展，國內的阿里巴巴、百度、科大訊飛，國外的谷歌、微軟、IBM等公司都試圖在這一領域搶佔先機。

《紐約時報》在訃告中，引述明斯基的同事、計算機科學家艾倫·凱(Alan Kay)的評價：“馬文在計算領域中具有罕見的卓識，他把計算機從花瓶般附屬機器的定位中解放出來，並意識到計算機的使命，是成為有史以來，人類能力最強大的放大器。”明斯基的遠見如今已經成為現實，但是在人工智能的搖籃期，他卻差點親手扼殺了我們今天享受到的一切。

深度學習技術的早期工作可以追溯至20世紀40、50年代，而明斯基正是這一領域的先行者。在哈佛大學讀本科期間，他曾開發了早期的電子學習網絡。在普林斯頓大學念研究生時，他又建造了第一台神經網絡學習機SNARC。1956年，明斯基與“人工智能”的提出者約翰·麥卡錫(John Mcarthy)以及信息論之父克勞德·香農(Claude Shannon)等人一同發起了“達特茅斯會議”，促成了人工智能革命的到來。

然而1969年，明斯基與西蒙·派珀特(Simon Papert)合著的作《感知機》卻被業內普遍認為極大地阻礙了神經網絡的發展。明斯基在這本書中重闡述了“感知機”存在的限制。他指出，神經網絡被認為充滿潛力，但實際上無法實現人們期望的功能。

在他看來，處理神經網絡的計算機存在兩點關鍵問題。首先，單層神經網絡無法處理“異或”電路；其次，當時的計算機缺乏足夠的計算能力，滿足大型神經網絡長時間運行的需求。

由於被明斯基這樣的權威人士看衰，神經網絡和深度學習技術的研究迅速陷入了低谷，70年代則成為了“人工智能的寒冬”。2014年加入谷歌的人工智能專家傑弗裏·辛頓(Geoffrey Hinton)當時正在讀研究生，他也感受到了這樣的“惡意”。當時，當他告訴周圍人自己正在研究人工神經網絡時，人們總會這樣回應：“難道你不明白麼？這些東西沒用。”

相關研究直到1978年才開始逐漸復甦，而其中的關鍵人物則是辛頓和哈佛大學神經生物學博士特裏·謝伊諾斯基(Terry Sejnowski)。據《紐約時報》記者約翰·馬爾科夫(John Markoff)在《與機器人共舞》一書中介紹，1982年，辛頓舉辦了一場夏季研討會，主題是聯想記憶的並行模型，而與會的謝伊諾斯基當時正在探索如何通過新方式來為大腦建模。他們的理念一拍即合。隨后幾年，從並行分佈處理方法起步，他們創造了新的多層網絡“玻爾茲曼網絡”。這項研究也證明，《感知機》一書中所做的預言，即感知機無法被推廣至多層網絡，是完全錯誤的。

辛頓和謝伊諾斯基隨后嘗試通過語言問題來展示新技術的力量。第一步，他們讓神經網絡去學習一本兒童讀物。在啟動的不到1小時內，神經網絡就開始工作。最初，它能正確出兩個單詞，而之后詞彙量開始越來越豐富，並開始自我完善。隨后，他們向神經網絡提供了更複雜的學習材料，例如一本有兩萬多個單詞的詞典。在經過不斷學習后，神經網絡甚至能朗讀從未見過的新詞。

他們將這一程序命名為Nettalk。這一神經網絡整合了300個被稱作“神經元”的模擬電路，並分為三層，包括用於捕捉單詞的輸入層，用於表達語音的輸出層，以及連接兩者的“隱藏層”。Nettalk的大獲成功重新點燃了研究人員對神經網絡和深度學習的熱情，並成為了隨后所有相關研究的基礎。

實際上，在進入80年代后，《感知機》一書提到的兩大問題都已得到解決。一方面，摩爾定律的應驗使計算機處理能力飛速提升，計算能力不再成為制約神經網絡的因素。另一方面，反向傳播算法的提出解決了關於“異或”電路實現的難題。隨后的近30年中，隨軟件算法和硬件性能不斷優化，深度學習技術終於可以大展拳腳。近年來，移動互聯網的快速發展、數據量的激增則給神經網絡提供了充足的學習材料。

然而，明斯基仍不看好神經網絡和深度學習技術。2007年，在新書《情感機器》出版的不久后，《Discover》雜誌的蘇珊·克魯格林斯基(Susan Kruglinski)對明斯基進行了採訪。后者再次重申了自己的觀點：

“人工智能領域的每個人都在追求某種邏輯推理系統、遺傳計算系統、統計推理系統或神經網絡，但無人取得重大突破，原因是它們過於簡單。這些新理論充其量只能解決部分問題，而對其他問題無能為力。我們不得不承認，神經網絡不能做邏輯推理。例如，在計算概率時，它無法理解數字的真正意義是什麼。”

關於理想中的人工智能技術，他認為重要的一點是使其具備常識性知識，而不僅僅是對圖像和語音的模式識別。在他看來，人工智能應當類似於人腦，而“人類解決問題的方式首先是具備大量常識性知識”。隨后，他還希望能實現《情感機器》一書中描述的思維體繫結構，使人工智能在各種思維方式間切換。

行業的發展並沒有按照明斯基的設想去推進。被譽為當前“人工智能三駕馬車”的辛頓、延恩·勒昆(Yann LeCun)和約書亞·本吉奧(Joshua Bengio)正受到業內的追捧，而他們關注的領域均為深度學習。辛頓已加入谷歌，而勒昆則成為了Facebook的人工智能業務負責人。

2011年左右，谷歌啟動了Google Brain項目，而最初的項目負責人吳恩達是深度學習領域的專家。利用來自YouTube的上千萬數字圖像，谷歌的神經網絡進行了自我訓練，而學習效果超過了此前所有項目。由於YouTube上大量關於貓咪的影像，這一系統甚至自己學會了識別小貓。科學家將這種機制形容為大腦視覺皮層控制論的“表親”。這一實驗採用了1.6萬顆處理器構成的神經網絡集群，但與人腦的數十億個神經元相比，只是九牛一毛。

利用深度學習技術，谷歌是否已踏上了“人工大腦”的道路？這個問題正引起越來越大的爭議。但業內普遍認為，深度學習技術幫助人工智能研究在視覺和語音領域取得了長足進步。在硅谷，越來越多科學家和工程師認為，深度學習將最終帶來“強人工智能”：機器的智慧水平將超過人類。

2013年，明斯基在麻省理工學院的學生、知名未來學家雷伊·庫茲韋爾(Ray Kurzweil)接替吳恩達，出任Google Brain項目負責人。在谷歌強大的神經網絡的基礎上，庫茲韋爾的到來或許將可以幫助明斯基實現未盡的目標。

人工智能的未來或許可以用明斯基2014年的一段話來總結：“如果你讓計算機自己待，或是讓許多計算機待在一起，那麼它們可能會試圖了解，它們從何而來，它們是誰。如果它們突然看到一本關於計算機科學的圖書，那麼可能會嘲笑：‘這太假了。’而不同的計算機群體可能也會有不同想法。”

‌