menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

時事

大數據:從技術現象到商業與社會變革

鉅亨網新聞中心 2014-04-24 08:24


李蕾

2013年商業世界最關注的一個詞是什麼?無疑是“大數據”。


各行各業、每個角落都有大數據的蹤影:電商平台、購物中心、銀行、酒店……即便宅在家裏足不出戶,它也能洞察你的需求並及時奉上你想要的資訊、商品或服務。

這與涂子沛的料想几乎完全一致。2012年7月,這位常居美國的信息管理專家、曾經的數據倉庫程序員出版了《大數據:正在到來的數據革命》(下稱《大數據》)一書,用“中國人自己的故事”提醒大家:大數據來了!話音未落,2013年大數據的浪潮就席捲了整個中國。

“變化太快、太大。”這是涂子沛這一年多以來最常慨嘆的一句話,他把這些新現象全部歸結到新作《數據之巔》當中。

用他自己的話來,《大數據》主要注重於新的現象和挑戰,《數據之巔》則從歷史的縱深上去追溯數據的來龍去脈,在這種講述中對中美兩國進行橫向對比,“中國現在有后發的優勢,數據和軟件的出現為我們實現商業變革和跨越式發展提供了新的可能性”。

變革

第一財經日報:去年年初,您在本報發表的一篇文章裏希望2013年是中國社會的大數據年,現在,您如何評價這一預期?

涂子沛:完全達到了預期,我能感受到現在中國社會對新的技術、新的理念有一種非常迫切的熱情和需要。

2013年,大數據佔據了各大新聞媒體,只要是高科技的會議總會談到大數據,甚至兩會上都有大數據的分析。我去年在國內做了幾十場演講,面向企業、金融機構、高校和政府的都有,我甚至受到許多中小城市地方教育局局長的邀請。每一場論壇都能收到很好的反應和回饋,讓我體會到了中國社會對新技術、新理念的渴望。

這也正好明了大數據不僅僅是一種技術現象,它還是一個商業變革和社會變革。

日報:大數據在國內應用的發展是怎樣的一個過程?

涂子沛:大數據的應用階段其實就是它的一條發展曲線。

任何一個新技術、新理念的發展都是一個漸進的過程,很多人在不斷地認識它,然后會突然出現一個爆發和上升,所有人都開始談論它並它的好處。但實際上,這個“熱詞”肯定也存在泡沫的成分,我們現在就屬於這樣的情況。

但到了一定階段大家就會發現,原來這個東西也沒有我們想象的那麼強,它也存在問題。這時候就會有人發出批評的聲音,從神化它變為醜化它。美國社會就到了這個階段,不斷有人對大數據提出批評,我們中國社會也差不多快到了,這代表我們正在進入下一階段。

這個新階段更加理智,大家可以更加理性,平靜地對待大數據,讓它成為我們生活的一部分。這個時候在技術層面上會開始發展並逐漸上升到某個高度。從這個角度來講,大數據不像是雲計算,后者只是一個純技術問題,而前者是一個涉及到商業管理、商業變革甚至社會變革的持久問題,起碼在未來幾十年都會是焦點。

日報:總結來,一共是五個階段?

涂子沛:一共是五個階段:一開始是一個認知期,大家都在爬坡、認識。第二是一個過熱期,所有人一擁而上、參加討論。接下來是一個冷卻期,人們發現大數據不是萬能的,開始降溫。然后會出現一個平穩的發展期,技術應用到商業運營的各個環節和生活的各個角落。最終大數據的理念也成熟起來,成為我們生活中習以為常的一部分。

進步

日報:硬件和軟件方面的提升在大數據的發展過程中分別扮演了怎樣的角色?

涂子沛:硬件扮演的角色就是提供物理基礎,這可以用摩爾定律來解釋,它很大程度上降低了數據的保存成本。例如,1TB的容量足以把整個圖書館的內容保存下來,現在1TB的硬碟大約售價為45美元,也就是花300元左右就能把整個圖書館拷貝存儲下來。而這個價格還在持續下降,未來20年內或許用一杯咖啡的錢就能買到。所以硬件的發展提供了大數據應用的基礎。

而軟件則是執行計算的工具。使用數據的唯一方法就是計算,數據的價值是通過軟件來體現的。對大數據而言,硬件方面是容量的尺度,而軟件則是價值尺度,大數據最后還是要落到這一價值上。另外,因為大量數據的存在,軟件本身的功能也會得到大量改善。例如建模,數據多的情況下就可以建一個更好的模型。軟件以挖掘數據、使數據生價值為使命,而大數據的出現反過來促進了軟件功能的提高。

日報:在數據的分析和使用中出現了哪些新興的工具?

涂子沛:主要是數據挖掘和機器學習,它們之間也存在很大差別。

數據挖掘就是建一個固定的模型去分析數據,但機器學習的模型卻是靈活可變的。也就是,數據越多,機器學習的模型就能自我調適讓它更加精確。

舉個例子,現在圖形挖掘中的一大難點就是人臉識別。如果按照數據挖掘的方式來做,可以通過人臉的特點把模型建立起來。但如果是機器學習,一開始只是建一個初步的模型,建好之后再拿成千上萬的臉部圖給這個機器,它就會自己去判別每一張臉的特點,然后改善模型。原來在數據挖掘的固定模型之下,判別的失誤率很高,而機器見的臉越多,它的識別率就越高,判斷就越準確。

數據挖掘是一個固定的模式,不會輕易改變。但機器卻可以在識別和處理人臉越來越多的基礎之上調整各種參數,讓自己的模型越來越準確,所以稱之為“機器學習”。在這種情況下,機器和人一樣獲得了智能,甚至能生判別。

大數據最重要的意義一個是整合,另一個是自動化。通過大量數據的整合,人們能發現以前所不能發現的知識,於是生了價值。第二,可以通過大數據讓機器獲得智能,實現自動化,這也是人類使用數據的巔峰狀態。

新模式

日報:大數據怎樣改變了傳統行業的商業模式?

涂子沛:這次回國我參觀了通聯數據這家公司,這是一家新興的創業公司,他們要用大數據開發新一代的基金管理和交易的平台,具體做法是收集大量的、多源的、實時的數據,為基金經理和投資者提供數據分析、查詢和判斷。通聯數據也在思考探討如何用大數據去衡量小微企業的信用,或許這能開創一個新的商業模式。

另外,浙江的銀江電子股份公司也在思考如何利用大數據技術來幫助浙江省政府解決醫療保險中的欺詐行為。這樣的創新依賴於醫療領域豐富的數據。教育領域也有非常多的數據可以用,比如高考數據要是開放出來讓民間去挖掘,一定能得出大量有助於考生填報志願、優化錄取過程的結論。

除此之外,公共領域也有一些新的應用,政府也在嘗試破冰。例如,廣東省正在用大數據來抓假車牌,我從廣東省的經信委得知,僅2013年就抓了50多輛套牌車。

這種基於大數據的競爭是一種精細化競爭的要求和表現。但總體而言,國內的商業競爭還是比較粗放,很多決策也都是拍腦袋。所以在《數據之巔》裏面我提出,數據是從“中國製造”到“中國創造”的抓手,也決定商業形態從粗放向精細化轉型。

日報:數據使用方面出現了哪些新的商業模式?

涂子沛:數據的使用要兼顧個人的隱私保護,目前已經出現了一種全新的商業模式:用戶授權使用。

毋庸置疑的是,未來消費者隱私的保護就是要把權利交回到用戶手中,要用戶授權才能查詢個體生的數據。

美國有一家經營小微企業貸款的公司叫做Kabbage,它會收集企業的很多數據來作為是否發放貸款的依據,其中一項是用UPS發了多少快遞。但這裏存在一個問題:Kabbage要去UPS查詢企業的快遞記錄,但UPS需要該小微企業的授權同意才能這麼做,即使該企業同意,UPS公司也可以拒Kabbage的要求。最終的結果只能是,即便用戶授權了,Kabbage需要查數據時也要付錢給UPS。對UPS來,數據就是資,這就是新的商業模式。

另一方面,小微企業也可以直接找到UPS,希望拿到自己的數據。但數據經過它自己的手,Kabbage就可以質疑數據的真實性從而拒接受。因此這些企業可以尋求UPS的數據認證,然后再將其交給Kabbage。這樣一來,UPS就可以向小微企業和Kabbage兩方都收取費用。

從這個例子中可以看到用戶授權、隱私保護、數據資、第三方框架怎樣使用數據等內容,這就是未來數據商業的模式。getty圖

文章標籤


Empty