menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

科技

搜狗王小川:人工智能在博弈游戲中會橫掃人類

鉅亨網新聞中心 2016-02-03 18:24


新浪科技訊 2月3日下午消息,谷歌發布旗下深度學習研究成果——圍棋程序AlphaGo后,引起熱議。關於3月份與韓國圍棋國手李世石的較量也讓業界紛紛展開預測。同樣是搜索起家的國內互聯網公司搜狗創始人王小川,近日發表看法稱,在人機圍棋大戰中,他堅信AlphaGo會完勝李世石。

王小川表示,從初中開始就迷於用算法來解決游戲中的博弈問題。在前幾年深度學習出現后,曾聯合清華大學聯合實驗室做過探索,但由於氣場和能力方面的欠缺,未能取得突破。不過,堅信算法參與到圍棋游戲中,大方向可行。


王小川在看了谷歌發布的消息后,從三個方面評價了AlphaGo背后的技術和實力,認為深度學習下的AlphaGo已經具有了“自學習”的能力,這是谷歌此次發布AlphaGo消息中最具震撼力的地方。

此外,王小川還談到了谷歌和Facebook在AI領域不斷髮力的背后原因。“下圍棋只是體現人工智能進步佳的宣傳點和切入點,從公開的文獻可以看到,DeepMind做圍棋研發是基於通用的技術進行,領域無關的(Domain independent)。這樣的技術未來可以用到合適的其他領域裏去。”

這位搜狗CEO還斷言:除了圍棋,人工智能在其他博弈類的封閉游戲裏,也會橫掃一切,完勝人類。(李根)

以下為搜狗CEO王小川的評論全文:

AlphaGo的發布,是一個偉大的里程碑,又一次讓我興奮得需要一。

先我的斷言一:AlphaGo在兩個月后,將會完勝李世石。

留個關子,本文最后再斷言二。

從中學開始,我就迷用算法來解決游戲的博弈問題,用搜索方法創新性完成過一些題目。這幾年深度學習出現后,就感覺有機會能夠突破圍棋,和清華的聯合實驗室做過幾次探討,都認為這個方向可行,可惜限於氣場和能力不足,沒能組織進行這方面的投入。

而此次出手的,是Google旗下的DeepMind團隊,在深度學習方面是最頂尖的,資源、能力、氣場都沒有問題,突破性的技術是基於深度學習進行估值和走棋。

看知乎裏好多討論,是從之前AlphaGo完成的棋局來判斷其下棋風格,倒推這個算法的威力,有點刻舟求劍的感覺。我們核心還是要回到對這次AlphaGo用到的技術的深刻理解。為了便於討論,我們對比以搜索剪枝為核心的深藍下國際象棋,和以搜索剪枝+深度學習為核心的AlphaGo的三個區別:

1. 圍棋相對象棋,最大的區別是棋局的評價函數極難定義。象棋可以找到各種“特徵”來計分,比如丟一個馬扣多少分,兵往前拱到離底線近了加多少分,而圍棋做不到,密密麻麻的黑白子挨,互相之前又有關聯,變化多,規律難以總結。這也是傳統算法相對人最弱的幾個問題之一。就像是我們人做人臉識別,看一眼就知道是張三李四,而機器算法難以下手。這個問題恰恰是最近幾年深度學習最大的突破之處,深度學習不需要人來設計算法“找特徵”,通過大量原始數據和標籤的對於,機器就能夠自動找特徵,並且並不比人差。在幾年前還有很多人認為機器在圖像處理方面舉步維艱,怎麼定義和抽象鼻子?耳朵?眼睛?可就在這一兩年深度學習突飛猛進,一舉超過了人類。就在2015年,人臉識別方面,機器的識別能力已經超過了人了,這可是人進化了數千萬年的核心能力之一呀。一個圍棋棋局,可以理解為一張19*19的圖片,其他的走棋規則和非常簡單(很容易翻譯成計算機規則),正好落入了深度學習擅長的事情。搜索+深度學習,這個算法完全可以覆蓋圍棋的規則,人下棋的思維過程和模式,只是AlphaGo的一個子集。這就決定了這個算法沒有天花板,有機會在圍棋領域“打通關”。

2. 深藍相對AlphaGo,AlphaGo最大的優勢是“學習能力”。深藍的開局更多依靠資料庫棋譜的建立,但沒有泛化能力(不懂得舉一反三),對於沒有見過的走棋方法就可能犯傻。而之后的核心能力是計算力,通過暴力的搜索(當然也有最優秀的剪枝,但還是暴力),力圖走出10-20步棋來選擇最優的路徑。這個複雜度是指數級的,變成一個NP問題,受限於計算力。這個系統的算法是寫死的,固定的參數下,就會有固定的表現。而調整參數和改變算法,都是工程師的事情。這個系統的天花板是計算機有多強,以及工程師有多聰明。而AlphaGo更多是數據驅動的,喂給他更多的棋局數據,他就能夠優化“神經元網絡”,同樣的運算資源下變得更聰明,並且具有舉一反三的能力,這一點非常接近於人(或者本身就是模擬人的方式來設計的)。而且我們知道,機器處理數據的能力足夠地快,以及沒有情緒不會出錯,這就決定了這個系統如果把今天互聯網上能收集到的棋局都學一遍,就成為頂尖高手了。

3. 最最最可怕的還不只是前面這兩點,對於下棋博弈問題,AlphaGo還不只是從互聯網上去收集數據進行學習,更可以自己和自己下,實現“自學習”。看過電影“超驗駭客”沒有?人工智能可以做到隨時間的推移就能更加聰明。金庸小中老頑童讓自己左手和右手打架“左右互搏”,成為天下無敵的武功,那個只是故事,在下棋這個領域,而AlphaGo有這樣的設計,讓這種武功成真了!往下還有兩個月的時間,AlphaGo這樣一台算法上沒有天花板的機器,很有機會在“左右互搏”下登峰造極,成為不可超越的圍棋高手。

AlphaGo的技術問題講完了。怎麼來看Google背后的完整動作呢?有人覺得是過度解讀了,實際系統挺糙的 -- 選的都是“歐洲冠軍” -- 明系統並不行,這是一種錯誤的理解。更有可能的原因是Google和Fackebook在競爭下圍棋,Fackbook的員工缺心眼提前放了好多消息出來泄密了,結果Google就趕緊把Nature的文章發了搶了個先,然后賣個期貨兩個月后和人類對決,那會兒系統就足夠好了,這是在競爭環境下合適的做法。

事實上Google和Facebook兩家都認識到了AI的重要性,以及就在最近幾年會有大的突破。Google 4億美金收購了DeepMind,當時只有20人,現在已經突破200人了,並且是不計代價的瘋狂投入。下圍棋只是體現人工智能進步佳的宣傳點和切入點,從公開的文獻可以看到,DeepMind做圍棋研發是基於通用的技術進行,領域無關的(Domain independent)。這樣的技術未來可以用到合適的其他領域裏去。深度學習的魅力在於,只要一個領域裏能夠建模,能夠有充足的數據,就能夠在這個領域裏做到超越人、取代人,短時間能從0分做到99分。如果我們依然是老觀念,用漸進的方式來理解機器智能,比如之前某位大佬宣傳他家的XX大腦做到了X歲的智力,這是很誤(che)導(dan)的。我們同樣也會錯誤地估計下圍棋方面機器的能力,按照人類的理解1D-9D來評價它。一句話,不要用評價人的方法來評價機器的人工智能的能力,完全是不同的模式。

老羅曾經評價過人工智能的一句話:“人工智能就像一列火車,它臨近時你聽到了轟隆隆的聲音,你在不斷期待它的到來。他終於到了,一閃而過,隨后便遠遠地把你拋在身后”。

如果給這句話打上一個補丁,把人工智能的應用局限到一個一個的具體的封閉領域,這是一個很貼切的描述。我們不要過度自大,例如我們容易在自我優越感的驅使下,動物不如人,比如人會直立行走、會話、會實用工具,以區別於其他動物。事實證明,動物也會。面對機器也一樣,就在幾個月前還有人叫囂機器十年內不能夠玩轉圍棋,理由也都是人一眼就能看明白,機器只會計算。這些自大會讓我們誤判。也不用過於自卑,覺得圍棋上機器上勝利了人類整個智力就被碾壓了,到今天機器還是有很多領域完全無能,只能在局部領域。

到結尾,再斷言二:除了圍棋,人工智能在其他博弈類的封閉游戲裏,也會橫掃一切,完勝人類。

文章標籤


Empty