百度余凱:學習是智能的本質 經驗就是數據
鉅亨網新聞中心 2015-01-18 09:23
新浪科技訊 1月17日消息,在上午的2015年極客公園創新大會中,百度深度學習研究院(IDL)副院長余凱作了《百度大腦所思考的人機關係》的主旨演講。在他看來,經驗就是數據。而隨過去的經驗數據,能夠不斷的學習、提升,今天可能不聰明,但明天會變得更聰明,這是智能的本質。所以,學習是智能的本質。
余凱認為,有關智能非常重要的方面就是經驗。在人工智能領域叫做經驗數據。所以,經驗就是數據,數據就是經驗。
演講中,余凱介紹了深度學習領域。他指出,百度深度學習落地,是在搜索、廣告投放、圖象識別、語音識別,這些方面,都有相當的進展。
此外,余凱還提到了自動駕駛技術,並現場展示了百度自動駕駛自行車。(尚紫)
以下為余凱演講全文:
各位朋友,早上好!天氣非常寒冷,但我們的熱情遺憾非常火熱,因為夢想在我們心中,這是為什麼大家今天早上來到這裏。
在我演講之前,先給大家放一段有趣的視頻。
正如大家所看到的,這輛車開進了我們的會場,它正在從我的左側往它的右側開過來,它上面沒有人,它自平衡的在行走,看起來有點“詭異”。
時間很快,大家可能沒有看清楚,沒有關係,有機會大家可以在會場外面看。
為什麼我們會做這樣一個有趣的自行車,它是真正的自行車,我們以前的自行車不是自己行走的,這才是真正的自行車。
為什麼做這個事情?這就涉及到我今天給大家演講的話題,就是百度大腦所思考的人機關係。
百度在過去兩年時間裏,在人工智能這個技術上投入了非常多精力,無論在技術投入、成果和人才佈局上面,受到了廣泛關注。這是麻省理工學院的科技評論雜誌今年8月份的一篇文章,講中國的一個互聯網巨人開始有夢想,講的就是這方面的情況。
大家可能會好奇,什麼是人工智能?這是一個很嚴肅的學術話題,但在今天這個會場,我想我們抱對科技的熱情,我們不需要那麼嚴肅,可能大家跟我一樣是一個科技粉絲,看過這樣一個電影。這個電影硝基漆人叫做哇裏,從個案例上可以稍微看一下人工智能具有什麼樣的方方面面。
首先,看一下,這個小機器人有感知的能力,有眼睛,可以感知這個環境,比如哪個地方是路,哪個地方是障礙物。在這個感知基礎上它會思考,然后理解。理解什麼呢?比如,這個地方是平地是可以走的,這個地方是突然下去的坡或者砍不能走,這就是理解。在理解的基礎上,完成自己的任務,去控制、去決策。
所以你看,從感知、理解到決策,在一個小的機器人身上,它體現的淋漓盡致,這就是非常直觀的來感覺人工智能涉及的幾個方面。
我們看,在今天的市場上,充斥“智能”這個詞彙,我們看到有智能手機、智能手錶、智能水杯、智能湯勺,Google前段時間在做智能湯勺,百度也在做智能筷子,還有智能手環、智能冰箱,等等等等,為什麼我們叫它們智能的品?它們是不是真的有智能?我們思考一下。
OK!我們把所有的品放在一邊,另外一邊是60、70年代的老式收音機。它們有什麼不同?它們都是在人操控的情況下,去完成一些任務。從這個角度來講,它們看似並沒有太多的不同。去思考這個問題,實際可以幫助我們去區分現在這些智能品,哪些可能是不一定具有智能的。
那我想,一個思考的角度是,舉個例子,如果在座的跟我是同一個年紀的話,在小學的時候可能學過一篇課文,這篇課文是講一個板凳的故事,有一個科學巨匠愛因斯坦,當時做一個很粗陋的小板凳,根據這個來可以他不聰明,跟他的小伙伴比可以得出一個結論他不是太聰明,但愛因斯坦每天都在做很多板凳,每次都在提升,根據他過去的經驗和教訓去改進他的下一次。所以,你動態的看,會發現是個不斷學習成長的曲線。
所以,這裏面智能的能力的本質在於什麼呢?在於,你是不是隨經驗不斷的演化,不斷的進步。正如今天這個會場我們的主題叫“覺醒、進化”,實際上進化是智能的本質。這裏面的經驗是什麼呢?經驗就是數據。那麼,隨過去的經驗數據,能夠不斷的學習、提升,今天可能不聰明,但明天會變得更聰明,這是智能的本質。所以,學習是智能的本質。
這裏面就提到了一個有關智能非常重要的方面,就是經驗。在人工智能領域,我們叫做經驗數據。所以,經驗就是數據,數據就是經驗。
這就涉及到今天經常提到的所謂的大數據,是因為現在迎來了一個偉大的時代,這個時代就是一個大數據的時代。
我們從一個角度來看,移動互聯網給我們帶來了怎樣的深刻變化。這是2005年在聖彼得堡教堂門口,很多信在等待教皇選舉的結果,8年以后新一代教皇重新選舉,同樣是那批信,同樣在那個地方,我們看到了移動互聯網怎麼改變了世界,每個人都連接了設備,這些設備無時不刻都在生數據。
我們看到,在今天可能在座的每個人跟我一樣,連接平均2-3個設備,比如我的口袋裏面就有兩個手機。但是,這個數據到2020年是一個不斷爆炸性增長的趨勢,甚至更加誇張的孫正義到2020年每個人要連接1000個設備,我相信這個不一定那麼誇張,你可能每個鈕扣都是一個智能的連接設備。
所以,移動互聯網時代萬物互聯,隨之而來的是什麼呢?就是數據的爆增。大量的數據給我們帶來前所未有的機會。所以,我們從萬物互聯到大數據時代,大數據時代隨之而來的就是無處不在的智能。
最近幾年,在人工智能領域我們經常聽到,最引人注目的領域叫做深度學習,為什麼深度學習跟大數據時代這麼悄然的發生在同一時代?這裏面有深刻的時代背景。我們看一下曲線,橫軸是數據規模,縱軸是系統服務的能力,隨數據的增長是怎樣的變化過程。
我們看到,傳統的人工智能算法,它的問題是,數據增長到一定程度以后,它的效果不再提升。對於深度學習,我們看是怎樣的曲線。隨數據不斷的增長,它的效果會不斷提升。
所以,深度學習能夠幫助我們吸收數據所帶來的紅利。如果從技術的角度是這樣看,那麼從商業的角度你會看到,如果你的商業模式,也是隨數據的增長呈現這樣曲線的話,那明什麼?那我要恭喜你,你有了一個非常好的競爭壁壘,為什麼呢?收集數據需要時間,別人要獲得同樣的能力,他需要花同樣的時間,或者更長的時間,所以你永遠跑在前面。其實搜索引擎就是這樣的模式,就是基於大數據的商業模式,實際是有很好的競爭壁壘的。
百度在過去兩年時間裏面,在深度學習領域,可以做了很多領域。在今天,百度大腦已經取得了相當的進展,它無時不刻的在學習、演進和進化的系統,它具有相當強的工程能力。在兩個月前我給大家介紹的時候百億級參數構建世界上最大的深度學習網絡,今天我把這個百億級改成了千億級,我們今天能構建更大規模的深度神經網絡,在此基礎上我們可以做很多很多事情。
具體落地的有哪些呢?深度學習,一開始它的基礎是跟大腦結構的發。今天我們是從統計和計算的角度看待這個問題,當然另外也有很多學者是從仿真大腦生物學角度做這方面的研究,我想這兩方面應該是牽頭併進、互通有無、互相幫助的。
至於談到,在百度大腦深度學習落地在什麼地方?我們可以看到,在搜索、廣告投放、圖象識別、語音識別,這些領域,都有相當的進展。比如我們看搜索,在深度學習之前綠色這個bra領先我們的競爭對手,在用了深度學習之前領先優勢拉升了兩倍還多,這是首次把深度學習成功的應用於搜索引擎。從另外一個角度講,它可能也是目前深度學習技術,用在自然語言方面最成功的一個例子。
當然,在廣告投放這個領域,整個百度的鳳巢廣告系統,今天已經進入深度學習的時代,它的廣告點擊率提升非常顯著,具體的數字因為是商業秘密我不能講,但是百分比兩位數的提升,所以這對公司的營收生了巨大貢獻。
在語音這塊,可以在過去兩年裏面,語音識別率不斷提升,在移動搜索的中文語音識別,我們是世界領先,應該是世界上最好的。
在圖像領域,這例子是在去年我們在物體檢測上面,單個模型實驗是世界上最好,百度是第一,Google是第二。
大家還可能會關心,在過去幾年裏面,技術的發展,比如在圖像分類這個領域,它是怎樣的量變到質變的過程。我們還是看圖像分類這個例子:在這邊我給大家演示的是最近幾年裏面世界上的成績是怎樣變化的,2010年的時候世界最好成績在那個地方,隨深度學習的發展,我們看到,每年都是以很快的速度向前演進。最近的結果,2014年底的時候,這個結果到了5.9%錯誤率,這是百度做到的,也是世界上最高的圖象識別準確率。大家可能會很關心,它離人類在這個圖象識別問題上,人類的能力是什麼水平。人類的水平在這個地方,它差不多接近5%的錯誤率。所以大家可以看到,我們平常每天上班、工作,但是不一定知道這個技術,最近這幾年,由於大數據的發展,由於深度學習的發展,包括工業界、學術界的投入,最近幾年是怎樣的變化。可以,這個進展是非常喜人的。
比如我們剛剛講到圖像,下面講到語音,反應到我們一個集中的品就是百度翻譯這個APP,你可以在紐約街頭句中文話,馬上語音識別翻譯成中文,然后自動翻譯成英文。還可以自動拍照,比如外國人來上海看到這個菜單,拍照識別成英文。用人工智能的技術,也可以幫助小朋友有快樂的童年,不用花那麼多時間做作業,可以花更多時間玩兒,我的小時候如果有這個工具我會非常開心,當然它不是幫你做題,而是告訴你知識點在什麼地方。
人臉識別的技術發展,也跟大家彙報一下最新的成果,去年Facebook人工智能實驗室,他們宣佈他們做到世界上最好的成果,是97.35%的準確率。前幾天,我在百度的同事,他們取得了一個更激動人心的進展,這是目前世界上最好的人臉識別準確率,達到99.62%。
朋友們可能也會問,現在人類的能力達到什麼水平,我可以告訴大家,斯坦福大學的科研人員,最近他們用人做了一個測試,人在這個數據上達到的是99.2%。
當然,我必須給大家澄清,在一個數據極上,機器的算法做到人的水平,但整體來講機器比人還是有非常大差距的,我們還在努力中。
大家小時候可能做過看圖話,看到這幅圖片要用自然語言描述這個圖片的故事是什麼。比如,我們對於左邊這幅圖,如果用自然語言或英文描述,一個黃色的圖景,也可以,下午的陽光照進房間,描述這樣一個場景。這些語言,實際上不是人來寫的,而是機器生成的。
很多很多人工智能的算法,它在不斷積累它的勢能,這會改變人們的生活,在方方面面,比如機器人領域,一個具體例子就是高度自動化的駕駛,這是百度深度學習研究院團隊的同學們改裝的各種車,這邊是我們的一個車上感知器的演示,這裏面整合了雷達、紅外、攝象頭,每一個感知器覆蓋了不同方面,有它各自的優勢跟劣勢,然后整合在一起對環境感知,對道路的情況有一個理解,然后它自動的能夠去行駛。
這是我們基於這些感測器,對道路有三維的理解,這個理解實際上可以做到比人更精確。比如,我們對道路上的車,今天的導航系統只知道你在哪條路上,不知道你在哪個車道上面,我們能夠利用更先進的感知系統,能夠使車定位在車道上面,精度是10-20厘米的距離。
我們可以預見,在后面的1-2年時間裏,整個導航系統會發生翻天覆地的變化。比如在北京的街頭上立交橋的時候,有的時候前面面臨3-5個分杈口,到底怎麼走看二維地圖你會懵掉,馬上科技就會幫助你發生改變。
這是我們在車裏做的仿真系統,利用深度學習開發圖象識別技術,用低成本完成這個任務。
我們對自動駕駛的認識是認為,完全沒有人的自動駕駛不是我們追求的目的,這是很難做到的,有可能在十年之遠的距離也許能夠做到。這中間是逐步實現的過程,它從輔助駕駛,也就是通過感知器,去通知這個司機發生了什麼狀況,他並不直接去操控車,然后到主動安全,比如發生小孩過馬路,感知到會主動控制車停下來,這是主動安全。然后特定環境下,比如高速上的自動駕駛,在大型物流中心的自動駕駛,到高度的自動化駕駛。整個過程,我們認為是從輔助駕駛到人車一體的自動駕駛。就是,整個系統是讓人去享受交通系統帶來的便捷和安全,但並不是取代人。所以,我們強調的是人車一體的自動駕駛。
這就回到我一開始我演講的題目,就是對人機關係的思考。我們稍微回顧一下人工智能的原點,很大程度上是因為圖靈測試,致力於研發能夠取代人的智能機器,這樣做是不是好?站在今天,我們不僅要跟隨先賢的思維,而還要自己思考。
在過去百度做的品我們可以稍微反思一下,有兩個品:第一個是PK大咖,給自己照張相能夠找到跟自己很像的明星,因為每人個都有做明星的夢想。另外是拍照寫識,識別了圖像之后還生成一首詩。大家對兩者的認知,從用戶反映來講,大家可能可以猜得到,拍照寫詩用戶的性能不是那麼大,它只是顯示機器有多麼偉大,而跟人到底有什麼關係呢?這是緣的。
左邊這幅圖是人工智能歷史上里程碑的歷史,IBM的深藍,它的象棋能力達到了冠軍的水平,然后就沒有然后了。右邊也是個人工智能的技術,它就是搜索引擎,搜索引擎使得在北京的一個小孩子,跟在遙遠山村的小孩子,只要有網絡,使他獲取信息、獲取知識的能力是一樣的,可以讓每個人變得更聰明,這實際就會對社會生巨大的影響。
再回到我們一開始開場的視頻,這輛自行車它可以跟你走,你在跑步的時候,也許你有衣服、有大衣,可以放到上面,有水,可以放到上面,你可以自己輕鬆的跑,跟隨你跑到自己的房間。大家想到了什麼?這是車嗎?我想在座有人的答案跟我是一樣的,它像一個小黑馬,跟你是朋友的關係,這就是我們對人機關係的思考。
我們認為,偉大的技術,它之所以偉大,不是讓機器更偉大,它最重要的意義是在於讓每個平凡的人更偉大、更有創造力,他的生活更美好。
所以,最后我修改一下毛澤東同志的語錄:世界是我們的,她也是機器人的。但是,歸根到底,她是屬於能夠創造機器人,能夠機器人和諧共處,並且利用機器人為我所服務的人的。
謝謝大家。
- 掌握全球財經資訊點我下載APP
文章標籤
上一篇
下一篇