menu-icon
anue logo
澳洲房產鉅亨號鉅亨買幣
search icon

外匯

大數據並不是越多越好 有很多局限

鉅亨網新聞中心 2015-01-28 08:15


導讀

大數據本身是一種實實在在的技術,所以應該不是一種泡沫。但在應用方面,在市場普及過程中,讓人們覺得無所不能,其實大數據還是有很多局限。


大數據應該關注的是,如何讓數據有用;另一方面,數據是不是越多越好?因為大家覺得是大數據了,不應該把數據浪費掉。但實際上不管你的計算能力有多強,總有一個計算負擔限度,首先計算的負擔越大,生有效結果的可能性就越小。現在大家都覺得算法可以解決這個問題,其實不行。

本報記者 滑明飛 上海報導

雲計算的舞台既有IBM、亞馬遜、BAT等巨頭,也有身形輕巧的創業公司。

“以前我們害怕BAT這些巨頭,就是怕被踩死。”1月26日,雲計算創業公司Anchora的CEO魯為民在接受21世紀經濟報導記者專訪時表示,目前雲計算整個領域都是比較新的,包括一些大公司的商業模式也都在摸索之中。

作為雲計算領域的一家創業公司,Anchora旗下的魔泊雲(MoPaaS)提供雲平台服務,即PaaS(平台即服務)。在2011年回國創業之前,魯為民曾在美國做過一個雲計算項目。即使現在他也經常返回硅谷,和朋友交流最新的雲技術和行業動態,以便在國內嘗試。

魯為民並不否認曾經對巨頭的顧慮,但他認為,目前這個行業越來越成熟,無論百度還是騰訊、阿里,聽得最多的關鍵詞都是“開放”,比如百度要開放數據,騰訊要開放服務,均是以一種開放的心態來和第三方合作。

“雲服務被視為一個很好的模式,但目前還很難賺錢。”魯為民表示,目前在技術層面,國內和國外相差無幾,主要的差距還是在應用層面,“在中國,某種程度上技術是超前的,但應用跟不上,可能還需要十年時間才能完全匹配”。

承上啟下的中間平台

《21世紀》:魔泊雲(MoPaaS)的商業模式是什麼?

魯為民:經過市場分析,我們發現很多企業並不在意你是做雲計算的哪一塊兒,他們希望自己的業務可以盡快部署好,所以MoPaaS的定義是基於IaaS(互聯網即服務)之上、SaaS(軟件即服務)之下的所有內容。MoPaaS希望在中間起到了承上啟下的重要作用,並立志於打造一個融合的生態環境。

你可以將其理解為一個雲開放平台,上接IaaS提供商,下游和SaaS合作,中間層除了自己提供的一些開發、調試工具和資源外,也會接入很多第三方的資源,讓開發者在我們的平台上可以得到一站式的服務。

同時我們也為客戶提供私有雲平台的技術解決方案,涉及的領域包括:國內外一些有實力的IT整體解決方案的公司,學校園區等政府機構,以及金融保險公司等等。

《21世紀》:IaaS、PaaS和SaaS等雲計算的三個層級中,PaaS被認為難以建立很好盈利模式的環節,你們為何依然專注這個領域?和之前的PaaS有何不同?

魯為民:一般情況下,IaaS只為客戶提供虛擬主機等最基礎的服務,但這對於開發者而言顯然是不夠的,所以需要MoPaaS這樣的平台提供應用開發、測試、調試等工具和資源等,上層承載SaaS,提供在軟件服務。

我將之前的PaaS歸為第一代 PaaS,他們有幾個問題:一是與提供基礎的IaaS割裂,沒有很好的連接融合,滿足不了開發者的需求;二是主要面對個體開發者,導致盈利很難;還有一些PaaS選擇了相對封閉的模式,不夠開放。因此,很多人不看好這種模式。

但我們一直認為,這個領域還是存在很大的機會,盡管目前很多企業已經升級為SaaS,但對於主流SaaS提供商而言,大多不會把更多精力投入到底層IaaS和中間層PaaS上,所謂術業有專攻。

同時,傳統的IT公司轉型做IaaS和SaaS是比較容易的事情,但對於PaaS這部分需要有強大的技術實力來支持,雖然門檻很高,但市場機遇也更廣闊。

我們目前的模式和以前有所不同,是一個雲開放平台,不僅面對個人開發者,也面臨企業級用戶,可以解決盈利的問題。

《21世紀》:目前有哪些合作伙伴?利益如何分配?

魯為民: MoPaaS整合了上下游的一些雲計算公司,下游的IaaS和上游的SaaS,只要是在這個生態中的都可以是我們的合作伙伴。目前我們跟一些大的雲公司,例如華為、金山雲、騰訊雲、青雲、Ucloud等都建立了合作關係。SaaS的部分我們整合了一些類似支付、CSDN、OSC、Gitcafe、Github、人臉識別技術等SaaS的技術功能。而合作的方式是多方面的,例如資源的互相調用,提供解決方案,以及分成,甚至建立合資公司等等。

大數據還是有很多局限

《21世紀》:你剛回國也做過一年的大數據,為什麼放棄而轉做雲計算?

魯為民:大數據當時是比較新的東西,了解的人不多。當時我們基於hadoop做了一些數據的處理、存儲和檢索的應用。但后來發現,很少有人用,那麼用戶離技術太遠,沒有一個好的框架讓用戶來使用一個好的工具。

我們之后就覺得與其提供這種零散的服務,不如找一個好的框架把服務包裝起來,而當時 PaaS剛剛在硅谷開始,所以順這個方向完成轉型。

《21世紀》:大數據和雲計算常被同時提起,你如何看待這兩者之間的關係?

魯為民:兩者關係緊密,就像我們的轉型,以前的大數據很自然而然地成為我這個雲平台的一部分。這些數據除了我們自己使用之外,也可以提供給客戶。

PaaS主要是跟應用接近,因為我們是支撐應用。現在很多應用離不開數據,比如一個應用想了解用戶的行為,那麼就需要收集很多大數據,此外,用戶和應用的交互很多方面也是通過數據來完成的。我們的雲平台實際上一個很重要的模組,就是提供各種各樣的數據服務,數據服務是屬於平台服務的一部分。

從大的方面看,這兩者之間是提供相互支撐的。大數據是雲計算主要的一個應用,同時雲計算為大數據提供一些能力,對有效地處理大數據有很大幫助。

《21世紀》:你如何看待目前大數據的發展?

魯為民:大數據本身是一種實實在在的技術,所以應該不是一種泡沫。但在應用方面,在市場普及過程中,讓人們覺得無所不能,其實大數據還是有很多局限。

大數據應該關注的是,如何讓數據有用;另一方面,數據是不是越多越好?因為大家覺得是大數據了,不應該把數據浪費掉。但實際上不管你的計算能力有多強,總有一個計算負擔限度,首先計算的負擔越大,生有效結果的可能性就越小。

現在大家都覺得算法可以解決這個問題,其實不行,包括深度學習實際上只是個算法。如果數據雜質太多就會拉低結果的準確性。我覺得應該把數據當作一種鏈的概念來處理。就是數據從進來到出來,每一個環節都應該有一定的處理,像清洗、刪選等。同時數據鏈的每個環節應該都有交互,數據處理完之后的信息必須提供給下一個環節,或者后階段的環節反饋給前面生一個更好的結果。只有從系統的科學角度來考慮才能處理,而不是直接把數據拿來就學習,這不太可能。

算法提供的東西實際上越來越有限,更多的是數據本身,如何用最少的有效數據,讓計算變得更簡單,這樣才能對它進行實時的處理,才能及時地給用戶提供有效的數據。

投資者還在觀察PaaS

《21世紀》:從市場來看,目前IT行業和傳統行業的需求有何不同?這兩個行業在使用雲計算過程中存在什麼樣的問題?

魯為民:傳統的企業以及IT行業對PaaS都有需求,IT企業接觸PaaS相對更早一些,傳統企業相對較慢一些。傳統企業的技術團隊可能要重新學習新的技術規範,因此,傳統企業中,高層都會大力支持,但下面的執行團隊可能還需要一些時間適應。

《21世紀》:資本目前如何看待雲計算的創業公司?

魯為民:資本層面上來,從去年到現在,對IaaS模式已經很熟悉了,一些創業公司都獲得了很大的融資,至少在這部分已經形成共識。

而PaaS,投資者還在觀察,但是我相信不會太遠了,我們已經獲得了資本市場的一些融資,因為價值已經體現了,收入也增加了,相信接下來資本市場會更關注這一塊兒。

(實習記者於逸凡對此文亦有貢獻)(編輯 施建)

文章標籤


Empty