大數據征信 “垃圾進垃圾出”怎麼破?
鉅亨網新聞中心 2015-12-17 08:14
主持
董希淼:恆豐銀行研究院院長
對話
楊曉軍:陸金所副董事長
邱寒:前海征信總經理
孔令強:中誠信征信董事長
童邗川:華道征信常務副總裁
周治翰:開鑫貸總經理
征信市場規模有多大?
主持人:很多人2015年是“征信元年”,在征信元年,關於征信市場規模問題大家怎麼看,征信是互聯網金融的“水電煤”嗎?
楊曉軍:我們現在這個市場(P2P)裏據有3-4年沒有征信記錄,這跟我們原來金融基礎設施的落后有關係。這個市場有多大呢?要回答這個問題可能取決於以后個人征信的公司到底能提供什麼樣的服務,服務質量是如何。
大數據能夠判斷征信必須是突破傳統線性的數據,更多的是關係型的數據來提供比原有征信機構更準確的判斷。目前來看由於數據的分割,個人征信公司用關係型的數據來判斷,來提出比原來征信、銀行的數據更高質量信息可能還比較困難。以后征信市場有多大,還取決於提供的服務有多大。
邱寒:征信就應該是互聯網,不僅僅是互聯網金融,應該是金融的“水電煤”,到水電煤是公用事業,今后市場有多大我想用電來舉例子,當年電剛剛被發現的時候,最大的用途是使用電燈、照明,如果按照那個時候的用法可以估算市場流量可能會嚴重低估。
現在征信最大的應用場景是借貸,如果問我今天的規模我完全可以按照市場的借貸規模估算用量,中國一共13億人口,最多也就1億人有信貸需求。多少次用征信,征信每一次查詢用多少錢,這很容易算出市場規模。
但這樣的方式計算出市場規模合適嗎?我覺得不合適。
互聯網大數據的征信發展是剛剛開始,還處在嬰兒期的水準,今后的發展從估算它的用量和市場規模來看,更取決於這個應用場景的拓展。前海征信從6月份開始對外推出,到今天為止的客戶裏面還是以借貸的場景為多,但越來越多非借貸場景在加入。市場容量可能會需要用發展的觀點來看。
孔令強:第一,征信對是金融的“基礎設施”,也是金融發展的“高速公路”。
第二,前段時間我也是在梳理行業市場容量的邏輯。券商拋出來1000多億,邏輯是基於前期征信是基礎設施,應用的場景是無限在擴充。
征信市場規模怎麼算,像美國除去三大征信中心以外有400到500家數據公司,圍繞征信市場去做的市場算不算金融?如果算的話,別1000億了,中國奔1萬億也不為過。
主持人:前段時間我們是看到了券商分析,國內的各種征信在1000億左右,有人認為這個數字被高估了,顯然邱總跟孔總不太贊成這個數字。
邱寒:就借貸而言是被高估了。
主持人:如果從借貸拓展到非借貸領域,這個數字可能是被低估?
邱寒:是的。
孔令強:邏輯很簡單,美國轉換率有多少,單價是多少,轉換率有多少一乘就出來了。國內也是,但是國內定位是現在這種技術規模,這種衍生邏輯是值得推敲的。僅信貸本身而言我同意邱總的觀點。
主持人:想象空間很大,關鍵看應用場景怎麼拓展。
童邗川:兩個問題一個是不是基礎設施,第二個規模有多大。第一個問題我回答,是。金融風險定價涉及到風控,風控涉及到征信,怎麼繞也繞不開。可能不光是互聯網金融要討論的問題,我覺得往大裏就是整個社會質押型經濟往信用型經濟轉變的問題。所以征信是一個基礎業。
規模問題,平安證券的報告是100億,富國銀行350億美元,就是2000億。征信中心每天查詢量企業25萬次,個人大概164萬次。前三個季度數據企業的查詢是6000萬次,個人查詢是4個億。簡單的一些數據大家都會做一些推測。
周治翰:征信業務跟傳統基礎設施領域相比有不像的地方,因為它的成本是不一樣的。基礎設施比如像郵政、自來水、供電有普遍服務的概念。郵政不管跨多少大山,跨多少河流也要送到。偏遠的角落電網也要覆蓋。但現在大數據的環境下,這點似乎就被弱化了。
大數據征信需要“試金石”
主持人:去年美國國家消費者法律中心,對美國主要大數據公司調研,發了一個報告,叫“大數據征信對個人征信的大十問”,稱進入大數據征信公司的數據50%左右是錯誤的,不完整的,有問題的,所以是垃圾。基於進入源頭存在垃圾,出去的征信報告,征信分析的一些品也認為存在垃圾。對於垃圾進垃圾出各位怎麼看?
邱寒:接手前海征信之前我負責平安集團大數據的工作。做數據跟挖礦有點像。數據裏面是存在價值的,就像每個礦有一定的含金量。數據也分為含金量高和低。
我覺得要解決大數據垃圾進垃圾出,需要兩個重要的前提條件。
第一得有試金石,你自己得懂挖什麼礦,別不知道自己挖的什麼。沒有積累過任何歷史逾期的信息就沒有試金石,沒有試金石的時候怎麼樣鑒別礦價值的豐富程度是值得懷疑的。
第二是挖礦的技術,剛才都講了天然的礦當中沒有一個百分之百的,不可能挖到的是純粹的金子。即使非常乾淨結構化的數據,中間也存在交易。數據質量有問題,真實性有問題,這就是做數據的人天天在面臨的問題。怎麼樣去把這個數據鑒別出來,哪一些是真,哪一些是假,怎麼樣把假的數據給過濾掉,把這些噪音給過濾掉,留下最為有用的一部分。
有沒有垃圾進、垃圾出的情況,有。有垃圾怕不怕?我覺得不怕,只要有試金石的技術不成為問題。
孔令強:所謂的垃圾進、垃圾出,焦點是出的是不是垃圾,出的是金子一定不會垃圾進,而這個核心的問題在哪呢?拿美國統計數據來,是針對互聯網大數據征信,不被主流征信市場所覆蓋的人群,他沒有金融強項和數據支撐,直接更準確判斷征信的水平、信用水平,就拿一些弱相關數據訪問。而在大量的實踐當中會發現,超過50%這樣的機構預測性是很低的,這種預測性的結果拿出來是垃圾出。
比如這個問題最早的時候我碰到過,就是做企業的信用評級,我們在各省的時候跟地方深度和小微企業金融做信貸評級。遇到最大的問題是報表失真,做假,花一千塊錢蓋章出來審計報告,拿那個審計報告不敢用。我們評級分析師要到企業去看他們賬,記賬憑證,看銷售能力,看供應商,把收入和利潤反算出來來判斷,盡量的來把這個水分擠掉,也就是把垃圾分解出來。為什麼會這樣?真的是缺乏手段。
童邗川:我個人的理解,大數據在征信上,實際上還是能起到非常大的作用。舉個最簡單的例子講,征信是什麼?征信這裏面我想講兩個,一個是征信主要解決三個問題,一、你是你,二、你的還款能力,三、你的還款意願。在反欺詐的問題上,大數據可以起到相當大的作用。
垃圾進,垃圾出的現象這肯定會有。在進的時候嚴格把關,在征信的數據準確性和相關性上嚴格把關。
周治翰:還是應用的問題。開鑫貸之前有一個股東,拿的是我們江蘇的企業征信牌照,有什麼優勢呢?是建設江蘇全省的600多家小貸公司的后台系統,小貸日常經營數據,每一筆放貸的借款人這些數據全部在它后台實時錄入的,按道理來,這個數據小也不小,還蠻大的。而且這個數據根據監管部門的要求入實錄入,我們應用這些數據依然發現有問題。
但是有問題不代表不用這個數據,還是能夠通過一些手段去把真實的情況鑒別出來。我們用非現場發現問題的苗頭,根據蛛絲馬跡結合現場的篩查基本上八九不離十,可能我們后台基於這些數據我們工作了四五天,到現場一兩天把這個帳翻一翻,驗證一下就非常好了。
楊曉軍:大數據征信存在的問題,傳統金融歷史上也存在過的,也是一些征信不可靠性,在2008年金融危機體現最充分的。歐洲的銀行過一句話,信用評級機構不能夠依靠買賬。我們看到很多很垃圾的CDO、CDS債權都被評為很高的級別。所以征信這種東西作為金融決策的一個參考,一種輔助手段,本身也存在一定的問題。現在征信行業開始用大數據的時候,肯定也會遇到一些技術上,或者方法上存在的問題,會有一個發展的階段。
當大數據進入到金融行業以后,我個人觀點是未來金融決策也會發生很大的變化。一些技術的應用改變金融決策的方式。
(本報記者 包慧 整理報導)( 編輯 辛繼召)
- 掌握全球財經資訊點我下載APP
文章標籤
上一篇
下一篇