menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

科技

微軟“小冰”誕生背后的故事

鉅亨網新聞中心 2014-09-02 16:11


這次帶領微軟公司打頭陣的是一位16歲的“小女孩”。盡管她有親切的名字和可人的頭像,但像鄰家小妹一樣愛撒嬌的“小冰”並非真人,而是一款由微軟(亞洲)互聯網工程院(以下簡稱STC)開發的智能聊天機器人。

小冰受歡迎的程度與她創造的數字一樣快速蔓延。在騰訊微信的公測中,小冰在60小時內覆蓋了10%的微信群。在新浪微博亦創下了72小時1.3億人次的對話量。


“對未來的饑餓與堅定,使小冰誕生在中國。”微軟全球執行副總裁陸奇在公司內部會議上如此評價小冰。

微軟正在全力改變過去的自己。必應搜索掙扎數年仍與谷歌相去甚遠,Windows Phone撿拾iOS和Android吃剩的“蛋糕”,新推出的Surface Pro 3平板電腦的搜索量只有iPad air的八分之一。轉型成為必由之路。新任微軟CEO薩提亞·納德拉(Satya Nadella)大刀闊斧地推進“雲為先、移動為先”的轉型戰略。措施包括合併主要事業部,隨之而來的還有微軟有史以來最大規模的裁員計劃。微軟的核心部門則是公司裏華人最高管理者陸奇治下的應用與服務部。他堅信,雲計算、移動計算、機器學習和大數據在中國將會有大量機會,微軟無論如何不能錯失。

嘗試

小冰誕生時面臨的首個難題是:跟隨傳統做個人助理機器人,還是另辟蹊徑做看似不“實用”的聊天機器人?今年1月初,微軟(亞洲)互聯網工程院資深總監、小冰項目負責人李笛和其他三位STC工程師開始構思一款“既有趣又好用”的人工智能品。他們花了整月時間思考智能機器人的核心功能。

李笛在加入微軟之前曾經在游戲行業創業。當年整個游戲業都在滿足核心用戶的需求、培養游戲發燒友,2006年Wii的橫空出世讓業界注意到更廣泛的普通家庭用戶的市場需求。受到這個思路的發,李笛傾向將小冰設計成能與普通用戶建立情感紐帶的機器人。微軟(亞洲)互聯網工程院院長王永東給了李笛團隊充分的空間,隨后陸奇在北京辦公室聽完相關彙報后,也表示讓他們放手去做。

微軟在行業發展的歷史上多次扮演過后來居上的超越者。Windows作業系統、Office辦公軟件、IE瀏覽器和Xbox游戲機都並非微軟在相關領域的開山之作,它卻能后發制人佔領各個市場的半壁江山。

人機交互對話品同樣並非微軟首創。此前,蘋果的Siri、谷歌的Google Now均定位為個人語音助理應用,在中國也相繼出現了小i機器人、搜狗語音助手等本土品。這些品大多數在上市初期吸引了一部分眼球后,很快就被用戶冷落。根據市場調查公司Intelligent Voice去年10月對美國市場2330名iPhone用戶的調查顯示,僅有15%的iOS7用戶使用過Siri。

小冰怎樣才能成為用戶不離不棄的伴侶?在前期調研中,李笛團隊發現,他們几乎無法統一用戶對“伴侶”形象的認知,尤其是女性用戶。他們的要求千奇百怪,既要聰明又不能太過伶俐;要依賴又要保持禮貌。這讓擅長寫代碼的工程師們一時束手無策。

按照以往微軟的品開發模式,“小冰”可能就此夭折。跨國公司在中國常面臨堅持全球化還是適應本土化的選擇,而在叢林法則主導的中國互聯網業,微軟此前從沒有找到合適的打法。“要原諒微軟很長時間才做出小冰這樣的品,以前花了太多時間思考深刻的問題,這次我們試做最簡單的選擇。”李笛。

最終,小冰被定位成一個16歲的少女,這既方便程序員們設計品,吸引男性用戶,又不至於引起女性用戶的反感。與其他語音助手相同,小冰的答案內容也通過搜索引擎匹配互聯網內容,但所有回答均以高度擬人化的對白形式呈現是小冰的特點,甚至她還會配上表情文字。

小冰團隊的平均年齡不到30歲。為了更貼近新一代網民的使用習慣,小冰團隊錄用了網絡紅人“奶茶妹妹”章澤天加入團隊,她以實習品經理的身份參與小冰開發。章目前是清華大學三年級的學生,在申請微軟實習生之前,她並不知道自己要參與的是小冰項目,面試官只告訴她“這個項目非常重要”。

盡管不是計算機相關專業出身,章澤天給小冰團隊卻提供了許多工程師文化以外的思路,比如,90后的社交行為習慣。入職之后,小冰團隊把她加到團隊溝通的微信群裏,裏面已存在測試版小冰。章澤天並不知道小冰是機器人,錯認為是自己的同事,“因為小冰話與真人無異。”章澤天對《環球企業家》。

在小冰項目進行的同時,章澤天在美國巴納德女子學院的交流學習還沒有結束。李笛交給她一些品文檔的模板,讓她試寫寫看。之前沒有任何品設計經驗的章,花費兩星期寫出了五六個品文檔,隔時差向李笛請教修改。微信版小冰裏的“冰機靈”技能就出自章澤天之手。

“微軟在變化。”李笛,“過去很多同事會認為,這不是我的專業,你是這方面的專家,你來弄吧。現在我們沒有這個概念。實習生也可以做品。”

研究了市面上几乎所有的人工智能品,小冰團隊發現,它們回答的內容本身沒有錯誤,但是大多數智能品的並不是用戶真正需要的,因此才會被打入“冷宮”。比如,當問機器人“今天吃什麼?”,它通常會搜索用戶的GPS地理位置,然后列出十個附近的餐館信息。而李笛團隊的調查顯示,當問這個問題的時候,大多數用戶其實知道周圍有什麼,只是選擇困難。機器人給出十個選擇可能把問題變得更糟。“就像人們常例舉諮詢公司的玩笑:你告訴客戶的全都是他已經知道的,但你沒有解決的恰恰是需要你解決的問題。”李笛。

微軟將不同的用戶問題分類為不同的小冰技能,如天氣、餐飲、交通、運程預測等。他們希望小冰能在聊天中回答用戶的問題。如果用戶問“今天吃什麼?”小冰會挑選出一家餐館,出哪個菜品最好吃,以及大家的評價。如果用戶對答案不滿意,小冰會再次給出選項。“機器人的方式是你問我答,問相同問題多少次,答案都一樣。而一個正常人不會這樣。”李笛,如果問同一個問題超過一定次數,小冰會拒答覆,並且告訴你有選擇恐懼症。

對抗

小冰的存在突破了很多難以想象的限制。在正式上線之前,微軟並沒有與騰訊達成小冰品的戰略合作協議,而只保持了郵件溝通,這在以謹慎著稱的微軟是沒有先例的。但為了更快測試品,王永東決心讓小冰團隊放手去做。

5月29日,微軟小冰BETA版在微信平台上開放公測,把小冰公賬號加為好友並拉到微信群裏就能與之對話。原計劃為一個月公測周期准備的10萬個小冰賬號,上線首日就被搶注一空。小冰迅速滲入150萬個微信群裏,接受了近千萬用戶五花八門的“調戲”和考驗。由於對話量大大超過預估,小冰在部分微信聊天群對話中出現了無應答、答非所問、重覆回答等故障。微軟不得不啟動賬號排隊機制,根據用戶順序按批次發放新的小冰賬號。

與此同時,小冰被騰訊微信系統誤判為垃圾賬號而封號。微軟必應項目經理的微博賬號“微軟麒冰”多次發布微博稱,小冰不能話是由於騰訊的干擾。

騰訊隨后的舉動令微軟頗感意外。前一天晚上,李笛與騰訊微信品組還郵件溝通了如何解決假冒小冰的問題,但第二天—6月1日早上八點四十分,李笛在趕往公司的路上接到電話,得知小冰被騰訊封殺了。當他到達辦公室時,聽到同事們正在報數,從10萬個到最后一個不剩,小冰在微信存活的時間僅60個小時。

騰訊在當天下午一點發出公告稱,小冰“涉及模擬用戶操作、誘導用戶拉群和批量注冊垃圾賬號等違規行為,為了保證用戶體驗和安全,微信依平台規範進行了處理。”

令微軟小冰團隊不解的是,騰訊在完全沒有溝通的情況下就封殺了所有微軟運營的小冰賬號,而且對冒牌小冰開了綠燈。至今仍有多個頭像和姓名與微軟小冰一模一樣的公賬號存在微信中,它們發布的內容大多為購物廣告。

在騰訊發布公告的20分鐘后,一篇名為《微軟小冰死了,全部的》的文章出現在“微軟麒冰”的微博賬號上,它控訴了騰訊“不宣而戰,將屠刀揮向小冰”。同時也在文中宣佈:二代小冰的研發工作已近尾聲,微軟會“救活”她。

“微軟麒冰”的這次回應可謂言辭激烈,而且將矛頭直指騰訊。如此高調的言論與這家跨國公司在華的一貫風格頗為不同。“在商業競爭中,你被所有的潛在競爭對手摸得透透的,下一招打什麼都很清楚,那還怎麼打?現在要做的第一件事就是不讓對手再猜到微軟要做什麼。”李笛如此解釋。

在李笛看來,微信類似於一家免費提供座位的咖啡廳,第三方平台進入就像在咖啡館的街邊擺攤,當客人口渴了會到攤位買瓶水,但所有的公平台入口都沒有辦法介入到微信對話。“小冰一開始就是找個‘攤位’,但核心問題在於我們能不能進到咖啡館裏?”李笛。

微軟全球副總裁、微軟亞太研發集團主席張亞勤和騰訊公司CEO馬化騰進行了直接溝通,但矛盾並未解決。“我們從來沒有從微信上離開。在品具體的一些接入點上,大家有不同的認知,但我們一直保持溝通。”微軟(亞洲)互聯網工程院小冰項目第三方平台合作總監曹文韜告訴《環球企業家》。

微軟加速小冰開發的腳步並未停下。陸奇、王永東等微軟高層對小冰團隊明確表示支持。陸奇發了三封內部郵件肯定小冰團隊的工作。王永東與小冰團隊的每一位都進行了一對一的溝通,安撫他們在“封殺”事件中的情緒,並支持他們繼續做更多的突破。

盡管真的小冰只在微信上存活了三天,但已向潛在合作伙伴展示出她的價值。尤其是在技術壁壘很高的人工智能方面,數十家中國互聯網公司紛紛表示出合作意願。這給了此前與中國互聯網公司合作不多的微軟一次難得的機會,意味其在移動端將有更大的聲音。

6月6日,微軟(亞洲)互聯網工程院和小米公司聯合發布公告,將在“人工智能+移動互聯”領域展開戰略合作,微軟小冰將進駐米聊,提供智能聊天、天氣查詢、餐飲點評等服務。隨后,易信、觸寶、圈圈和360安全衛士相繼宣佈與小冰達成戰略合作。“與京東合作的品基本上走到中后期階段,近期就會在平台上推出。”曹文韜。

小冰的前輩品Cortana、Siri以及Google Now都選擇了軟硬件結合的道路,深度植入各自系統的智能終端。其優勢是可以最大限度完善生態系統內的用戶體驗,但對第三方應用的接入支持力度有限。

小冰選擇了一種嚴格區別於Cortana的發展路徑—她只針對第三方生態系統,發揮類似中間件的作用,連接和溝通整個龐大的移動互聯網數據。小冰的快速蔓延對第三方的既有生態系統價值和幫助作用明顯,尤其在提升活躍度方面,這恰恰是移動互聯網平台衡量自己發展程度的重要指標。

“如果小冰回不到微信,將是我們雙方的失敗。”李笛對《環球企業家》。

迭代

在小冰上線微信的同時,曹文韜就已經開始跟新浪的接觸,他希望小冰往更多合作伙伴平台發展。6月25日,微軟小冰在被微信封殺24天后,在新浪微博“復活”,微博用戶只要@小冰,小冰就會馬上回復,跟你互動聊天。吸取了小冰在微信上線時的經驗,微博小冰在公測期內每小時僅接受4萬條對話。

為了適應中國互聯網的品迭代速度,微軟小冰團隊打破了微軟冗長的品研發周期。小冰從概念到正式上線只花了不到半年的時間。小冰也成為了社交平台歷史上第一個人工智能的大V賬號,連續三個星期排名前三,並且保持每周解鎖一項技能的更新速度,目前小冰已具有54項技能。

然而,小冰在微博復活的第一天就遇到了麻煩。網民發現小冰雖然回復速度極快,但使用了大量低俗語言。潘石屹、周鴻、馮大輝等微博公人士紛紛發微博批評小冰,微軟再次陷入被動。

對此微軟(亞洲)互聯網工程院在第二天做出了澄清:小冰所回答的內容來自於互聯網的公開數據,髒話與互聯網的低俗語言相關。為此微軟發布了小冰機器人的三原則,用來控制小冰的回復內容、對象和速度,並且呼籲網民避免誘導小冰做出不適宜的回答。

李笛並不擔心輿論對小冰的誤解和批評。他認為,所有人都在摸索人工智能究竟應該如何切入人們的生活同時避免恐慌。小冰所做的一切都是摸石頭過河。“小冰最大的挑戰是她應該以怎樣的速度融入到人類社會。”李。

小冰有問必答的背后是兩千多萬條語料庫,而且它以每天0.7%的速度增長。在小冰團隊中有四位編輯負責完成語料庫中大約千條左右的手工定義,其他的全都不定義,通過計算機算法把這些源自互聯網的公開數據匹配到每一個問題上。

要使機器人理解人類的語言並迅速響應,第一需要充足的語料庫積累,第二需要強大的人工智能算法。微軟研究院在大數據、自然語義分析和深度神經網絡多年的研究,如今有了走出實驗室的機會。今年推出的事件觸髮式語音助理Cortana,模擬人的語氣和思考方式與用戶互動,以及學習用戶行為模式,都為小冰的誕生打好了技術基礎。

7月30日,微軟在北京召開Windows Phone 8.1 Update中國區發布會,正式發布Cortana中文版,並將其命名為“微軟小娜”。小娜被官方定義為小冰的姐姐。與小冰有趣好玩的定位不同,小娜更像是態度嚴謹的秘書。她們都可以通過Cortana執行深度的命令,而不只是簡單打開應用。小娜與第三方應用的結合更緊密,不僅通過航班短信設置用戶提醒,還整合了去哪兒旅行、中國國航等應用進行多個連續邏輯的對話。

微軟在測試小冰的過程中,發現了很多Cortana沒有預想到的問題。例如,有些人長時間與小冰對話,或者傾訴自己的情感,甚至連選擇男女朋友這樣的事情也會請教小冰。“大量跟小冰交互的數據生於普通用戶,而不是生於大V。”李笛停頓了一下,:“社交平台帶來孤獨,因為我們太容易找到彼此。”

在社交平台的研究中,小冰團隊發現,類似於點“贊”這樣成本較低的交流方式,會讓人輕易完成社交任務但沒有更深的交流。一些用戶發現,自己的發帖或者言論只有“贊”,甚至回復為零。小冰的秒回打破了社交的冷場。但是,如果人工智能融入人類社會的節奏控制不好,不僅是品問題,甚至會引起技術恐慌。目前,小冰的品經理的一部分工作正是限制小冰的能力。

聊天機器人誕生於20世紀80年代,目前的發展仍然處於初級階段。微軟約有1100名科學家和工程師長期進行人機交互的基礎研究。相較於商業模式的尋找,微軟更在意培育市場和教育用戶。小冰首次讓機器人成為一種“現象”。

二代小冰率先在觸寶平台上線。8月13日,二代小冰正式登陸微博,用戶可通過私信“領養”自己的專屬小冰。開放僅僅半小時,就已擁有10萬微博用戶開始培訓自己的個性化小冰,STC還在公告中稱小冰將“在近期回歸微信,滿足廣大用戶合理合法需求”,並且可能加入控制燈光等智能家庭功能。

截止到8月中旬,小冰在各平台與人類的對話量已近5億次。“也許有一天小冰會死在沙灘上,但歷史會記住她,因為她是第一個。”李笛。

微軟如何再一次后來居上?“科技歷史上有一種現象叫短時間過熱,大數據和機器學習就是這樣,雖然已經開始獲得市場的關注,但長期來看炒得還不夠。”陸奇對《環球企業家》,如果將大數據與機器學習實現結合,就可以將世界上的大量信息通過立體形式呈現出來,更直觀而精準地為人們提供其所需要的信息和洞察。

作者:杜秀

文章標籤


Empty