menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

時事

AlphaGo贏得首場人機對決 奇點離人更近了?

鉅亨網新聞中心 2016-03-10 08:21


導讀

在技術派中,“懂技術”的李開復盡管看好人工智能的未來,但更看好“人腦”的當下。


本報記者 徐然 北京報導

一條叫“阿爾法”的狗火了。

3月9日下午3點30分,世界圍棋冠軍李世石中盤認輸。谷歌人工智能系統AlphaGo贏得了這場世人矚目的“人機大戰”首局勝利。

很多人歡喜雀躍,很多人黯然傷神。當然,比賽將持續到3月15日,圍棋所代表的“人類智力最后防線”能否抵擋得住人工智能衝擊仍未可知。

對於圍棋界人士而言,比賽結果有些難以接受。就在比賽前兩天,“棋聖”聶衛平在一場活動中公開表達了對電腦的“蔑視”。“我認為電腦存在不可逾越的技術障礙。圍棋中對於幾百萬種形勢哪種最好,人腦可以做出最有利於自己的判斷,但電腦面對複雜的情況完全無法判斷。”聶衛平,“我認為人百分百會取勝。電腦戰勝人腦這種法完全是忽悠。”

在技術派中,“懂技術”的李開復盡管看好人工智能的未來,但更看好“人腦”的當下。據分析,AlphaGo去年年底的圍棋等級分是3168,李世石的等級分大約是3532。“如果對弈一盤,AlphaGo尚有11%的獲勝可能性,而整個比賽五盤勝出三盤或更多,AlphaGo就只有1.1%的可能性了。”李開復在文中寫道,“當然,這是幾個月前的AlphaGo,也許今天已經超越了。”

《人工智能狂潮》一書作者,日本頂級人工智能專家松尾豐此前也曾表示,圍棋盤面組合數目比將棋等更龐大,人工智能在這方面趕上尚需時日。但沒想到,這一天來得這麼快。

但不少技術派堅定看好AlphaGo。地平機器人創始人、前百度深度學習研究院負責人余凱則完全對電腦的勝利抱有樂觀態度。“我頭天就預測電腦會贏,第一局我預測正確了。”余凱對21世紀經濟報導記者,“我預測的根據是算法的理論、人的弱點和機器的強項。可以,這是一場不平等的對決。”

不平等的對決?

中國圍棋世界冠軍古力直播本場比賽時曾介紹,根據AlphaGo對戰歐洲圍棋冠軍樊麾(職業圍棋二段)時的表現判斷,它大約處在專業初段的水平。這個水平根本無法對抗李世石(職業圍棋九段)。需要注意的是,AlphaGo和樊麾比賽是在2015年的10月5日到9日,據今已整整五個月。五個月,電腦能取得多大進步?

“當初谷歌用來訓練AlphaGo的伺服器還比較少,后來訓練的伺服器增加到了將近2000台。這些伺服器每秒的計算能力也是非常強的。” 余凱。然而李開復對於短期內通過增加伺服器的方法提升AlphaGo水平的方法持有懷疑。

根據今年一月《自然》雜誌封面文章介紹,從1202個CPU到1920個CPU,AlphaGo的圍棋等級分只增加了28分,而AlphaGo和李世石分數差距高達364分。“若要達到364 積分的提升,需要的CPU將達到天文數字,有篇文章估計至少要10萬個CPU。”李開複寫道,“假設有十萬萬台機器,它們的總計算能力很強,但是彼此的協調將成為瓶頸。在幾個月之內增加兩個數量級的CPU並調節算法、降低瓶頸,應該不容易。”

余凱認為,AlphaGo的優勢還在於其應用了蒙特卡羅算法(Monte Carlo tree search),這是應用於某些決策過程的搜索算法。“這種算法的特點是只要時間足夠,它能窮盡所有對局的方案,讓機器人充分學習。它突破了人類極限,讓電腦不斷自我對決並提升。”余凱向記者解釋。

輸給AlphaGo的歐洲圍棋冠軍樊麾在本次比賽前接受媒體採訪時表示,不僅僅是技術,“情緒和心理”也對圍棋比賽至關重要。“兩個人下棋的時候,你常常觀察和琢磨對方的情感和心理。但現在對面是電腦,你所有的感覺全部被打了回來,它沒有心態的波動。”樊麾所言也是余凱看好機器的重要理由,因為機器沒有情緒。“人有不穩定性,經歷、環境、各種偶然因素都可能造成影響;機器的算法可能有弱點,但它不會犯錯,在它的框架裏找最優的點。人會想贏得優美,大比分贏;機器不會,只要贏就行。”

此外,余凱認為李世石的首場失利還與其對電腦程序不了解有關。“李世石的優勢、弱點在過去的比賽中都暴露出來了。我相信比賽前AlphaGo應該把所有李世石的歷史數據都研究過了,但李世石對機器並不了解。機器算法包括價值函數和決策函數,李世石對機器的決策函數完全不了解。”

還不是一個時代

全國人大代表、科大訊飛董事長劉慶峰在3月6日下午的媒體見面會上也表達了對電腦的支持。“(人工智能)如果不贏,那是谷歌做得不好。”劉慶峰對記者半開玩笑地。但劉慶峰認為,無論輸贏“比賽對人工智能的影響沒有大家所想象的影響那麼大”。

1951年,克里斯托弗·斯特雷奇(Christopher Strachey)使用曼徹斯特大學的Ferranti Mark 1機器寫出了一個西洋跳棋程序;同時期的迪特裏希·普林茨(Dietrich Prinz)則開發了一個國際象棋程序。在上世紀五十年代中期至六十年代初,阿瑟·塞繆爾(Arthur Samuel)開發的國際象棋程序的棋力已經可以挑戰具有相當水平的業餘愛好者。時至今日的圍棋比賽,無論勝負,都明人工智能在特定規則領域內的精確計算和判斷正在達到或超越人類水平。

“對於有規則可循的運算,我覺得機器本身就應該比人強。”劉慶峰對記者。余凱也認同劉慶峰的觀點,因為“精確計算是機器擅長的,對事物的發展判斷及創造則是人的優勢。但機器缺乏舉一反三,從這裏學習到的能力到別的地方還用不到。”換句話,機器能在有序的棋牌世界暢游,但目前還無法適應無序的現實生活。

今年一月《自然》雜誌封面文章對AlphaGo進行了詳細介紹。文章稱,AlphaGo是一套為了圍棋優化的、設計周密的深度學習引擎。它使用了神經網絡加上蒙特卡羅算法(Monte Carlo tree search)。AlphaGo由創建於2010年的英國人工智能公司DeepMind研發。2014年,DeepMind被谷歌收購。AlphaGo強大計算能力也正是得益於谷歌巨大的雲計算資源。

談及AlphaGo的優勢,李開復認為,“如果AlphaGo今天要進入一個新的應用領域,用AlphaGo的底層技術和AlphaGo的團隊,應該可以更快更有效地開發出解決方案。這也就是AlphaGo真正優於深藍的地方。”深藍(Deep Blue)是由IBM開發,專門用以分析國際象棋的超級電腦。1997年5月,深藍擊敗了國際象棋世界冠軍卡斯巴羅夫。

“AlphaGo所應用的學習算法可以擴展到其他領域,但這種擴展是由人來做而不是機器。如果哪一天機器可以自己擴展學習領域,那就危險了。”余凱。

奇點臨近了?

余凱的擔心不是沒有道理的。早在1997年深藍打敗國際象棋世界冠軍;2011年沃森在美國電視智力問答節目戰勝歷代冠軍;2012年將棋電王戰中,被封為永世棋聖的米長邦雄被軟件Bonkras擊敗。

在《人工智能狂潮》裏面,松尾豐把目前的人工智能分為四個級別:級別一是單純的控制程序,級別二是傳統的人工智能,如將棋程序、清掃機器人等;級別三是引入機器學習的人工智能,內置於搜索引擎裏面,或基於大數據進行自動判斷;最后一級是引入深度學習的人工智能。第一級相當於臨時工,最后一級相當於經理。

松尾豐指出,雖然沒有必要擔心人工智能會征服人類,但不能低估人工智能的可能性。關於人工智能的發展應該有倫理規範跟進。“有關人工智能使用的操作和技術必須透明,控制權要分散掌握在多個人手中。”松尾豐表示。

(編輯:賈紅輝,郵箱:jiahh@@21jingji.com)

文章標籤


Empty