menu-icon
anue logo
澳洲房產鉅亨號鉅亨買幣
search icon

期貨

劉鐵斌:行業數據治理對市場發展的意義

鉅亨網新聞中心 2015-12-06 10:37


和訊期貨訊息 由中國期貨業協會與深圳市人民政府共同舉辦的“第11屆中國(深圳)國際期貨大會”於12月3日—12月5日在深圳召開。

本屆中國(深圳)國際期貨大會與往屆相比形式更加豐富多元,以“跨界、跨境、跨越”為主題,邀請了梅拉梅德等全球頂尖的金融衍生品專家、學者及深圳市政府及證監會領導、國內外主要交易所、金融企業、上市公司等領袖精英參會。大會將圍繞“如何更好地服務實體經濟風險管理,促進期貨與現貨、境內與境外、場內與場外、線上與線下的互聯互通以及金融混業、跨界融合的發展”等業界關心的重大課題深入研討。和訊期貨參與現場直播。


中國證監會資訊中心副主任劉鐵斌先生進行發言,他的演講題目是“行業數據治理對市場發展的意義”。劉主任對行業資訊技術十分熟悉,對行業數據治理分析也非常透徹、全面,做好期貨行業數據治理對於市場發展具有非常重要的意義。

以下為文字實錄:

劉鐵斌:尊敬的各位領導、各位嘉賓,大家上午好!這次應小國會長的邀請讓我講行業數據治理對市場發展的意義,這項工作對我們行業是非常重要的,而且這項工作是由很多專家來完成的,我在這里是對這項工作進行總結和匯報。這是今天要講的三個方面內容,一個是行業數據治理的概述,第二是專業領域的介紹,第三方面是展望。

首先跟大家匯報一下行業資訊化現階段重點工作,主要是分成四個方面:首先是行業開源聯盟,今年以來我們成立了行業的開源聯盟,成立了相應的開源開放的小組。主要的目的是為了將來在資訊技術方面能夠做到完全自主可控。開源聯盟對我們行業未來發展的意義非常重大,這是我們未來開展工作的一個重點。第二方面是行業網絡治理,這是以證聯網為基礎,去年上半年我們已經建立了行業的證聯網,行業所有的機構,包括證監會及其派出機構,所有的市場核心機構、證券期貨基金公司都接入了證聯網。現在已經有十幾家存款銀行剛剛接入證聯網進行系統測試,很快就能夠實現在證聯網內的轉賬業務。證聯網將來是除了交易以外行業的一個通信專網,以后所有的數據存儲,數據中心也是通過證聯網來存儲數據,包括行業的實驗室、測試中心,以及將來在證聯網當中還要建立一個測試網。這塊未來的發展會給大家提供更多更好的服務。第三方面是行業數據治理。第四方面是行業云服務,大家知道這些年云計算、大數據這些新技術為我們行業的發展也帶來很多推動作用。尤其是在云服務方面,實際上行業外的機構在這方面做得非常好,包括恒生的金融云,包括京東等等,他們做的云服務也非常好。我想更家重要的是我們行業內的云服務,這牽扯到行業的數據安全問題。所以我們非常鼓勵行業內核心機構積極承擔起行業內私有云的建設,能夠為行業所有的機構提供更好的服務。

數據治理是對數據資產管理行使權力和控制的活動集合,包括規劃、監控和執行。它包括很多,數據質量管理、數據架構管理、數據開發等八個方面。另外可以從戰略、組織與角色、政策和標準、項目和服務、問題、估值等方面進行數據治理的活動。可以說數據是最核心的資產。尤其在當前來講,數據安全是最重要的組成部分。所以我們也要求行業內所有的機構一定要做到數據的三點存放,本地、同城和異地存放。我們現在也對數據進行分級分類管理。

數據治理的意義有四個方面:首先是有利於行業數據統一,這對行業來講是非常重要的。后面所進行的一系列工作都是為了行業的數據統一。第二是促進行業標準化發展,降低數據交換成本。第三是便於通過數據特征發現市場異動,有效助力監管的決策。第四是推動資本市場業務功能發揮。

數據治理的戰略目標是全面建成具有國際先進水平的資本市場數據治理體系,支援多層次資本市場建設,為推進跨市場互聯互通,促進市場集約高效運行,降低市場成本,提升監管效能,保障市場資訊系統安全穩定運行奠定基礎。這是數據治理的戰略目標。我們主要是從五個方面進行數據治理的工作。

我先給大家介紹一下標準化的工作,這是跟數據治理息息相關的。證標委是國標委領導下的金標委下面的期貨分委會,證標委的工作是非常出色和優秀的,尤其是這兩年來我們通過劃分11個專業領域,我們成立了11個標準化工作組,每一個工作組有一位首席專家來引領這個領域的標準化工作。包括數據治理的五個方面,數據模型、基礎編碼、資訊披露、機構間介面和機構內介面。還有三個業務標準化工作組。還有系統安全和數據安全。這11個工作組最近是制定未來3-5年的標準化工作,我們要制定多少標準,未來標準化工作怎么發展,這是我們證標委所做的重要工作。從專業領域分類是五個方面,基礎編碼類,介面標準類包括數據模型、機構間介面、機構內介面和資訊披露。

行業數據的特點有八個方面,一個是標準化程度高,對整體性要求要求高,對業務持續性要求高,對外部環境依賴度高,變動頻繁,主體分散。我們有17家市場分析機構,有370多家市場經營機構,同時還和行業外有很多數據交換。發展時間短,期貨交易市場發展了20多年,是一個新興產業,但是數據的量是相當大的,每天產生的數據以t來計算。影響面也很大,尤其是證券行業交易行情的波動對整個社會的影響也相當大。今年就出現很多問題,行情波動的時候監管部門要數據,各個交易所報上來的數據都不一樣,在同一個項目上報的數據不一致,理解不一樣,導致監管部門收集數據相當困難,很難得到真實準確的數據,所以很難得出供決策參考的依據。

這是我們編制的行業頂層數據流圖和主要中介機構的機構內數據流圖。大家可以看到所有的這些線都是機構之間數據交換的數據流圖,非常復雜。這個工作主要是監管中心的謝部長帶領大家完成,工作也相當有效。行業數據治理包括這五個方面,首先給大家介紹一下行業編碼。這5個專業工作組18項具體的工作任務。基礎編碼類工作是相當重要的,它主要的內容是研究規劃行業的基礎編碼體系,組織制定行業編碼體系制定工作指南和一系列基礎編碼標準。現在已經在做的,包括證券期貨市場的金融產品、金融衍生品、參與機構、投資者、賬戶、相關金融工具等分類及編碼標準、規範以及相關的規範和工作指引。

這幾個工作組都在做一個事情,要規劃出來這個領域到底需要做多少標準。各個專業工作組首先按照幾個維度對整個領域的工作進行策劃,所以在這里面就是按照三個維度,按照參與人、產品和場所做出一個相當於立體的模型,把所有需要制定的標準點都找出來,找出來以后再來確定哪些節點需要做標準。然后從這個過程當中再提煉出來我們認為必須要制定的標準關鍵節點。按照這三個維度理出了大體的,后面還有很多表,今天只是簡要地介紹一下。

行業數據模型,這個工作是具有開創意義的一項工作,在國際上還沒有對證券期貨行業的數據進行完整的梳理。這里我會稍微多一點介紹這個工作。它是以證券期貨行業相關的法律法規、業務規則、制度及流程為依據,以交易、監管、披露三大業務線條為切入點,完成對行業中各種業務的全面遍歷。根據行業頂層數據流圖及機構內數據流圖來擷取市場全業務流程與數據共性,形成真正意義上統一、完備的具有通用性、穩定性和拓展性的資本市場多層次數據模型。這里分成三部分,抽象模型、邏輯模型到物理模型。抽象模型是規範和指導數據治理,統一各種協議、介面、編碼、報文格式等技術標準,建立基於數據模型的行業技術標準體系。邏輯模型是形成可以直接物理化的表,便於各單位應用系統物理化建設。我們現在做的工作邏輯模型這塊已經基本上完成,下一步就是從邏輯模型再到物理模型,會制定很多表格供大家使用。

這個是行業數據模型總體的方法論,是通過行業的頂層數據流圖來識別業務點,梳理數據模型。通過主體行為關係這個表,通過交易、監管和資訊披露這三個方面,最後分類、分層描繪產出物。下面這個就是數據模型的公式,p1就是所有的交易、監管、資訊披露,所有共性的數據組成p1這個集合。p2是說這三個部分各自的數據。p3就是每一個部分自有的數據,沒有重復使用過的數據。交易模型是從品種出發,以cfi為依據,結合國內資本市場現狀梳理出能覆蓋國內現有證券品種的品種樹,並從品種樹入手,對各品種分別按照行為、過程、進行遍歷,擷取數據模型的方法。監管模型不一樣,它是以相關的法律法規為依據,對監管對象、監管主題、監管方式進行立體分析,並在此基礎上梳理出數據模型的方法。披露模型是基於資訊披露模板,通過對應模板制定出語義獨立的數據表,提煉數據項和數據表,充足后進行邏輯推演和測試驗證,回歸迭代后形成數據模型的方法。

數據模型分成四類數據,一個是原子數據,業務上獨立的,能夠從行業模型構建的角度不需要再分的最小數據單元。復合數據是原子數據通過某種關係組合或加工而成,依照復合方式可分為結構性復合數據、計算類復合數據。可復用數據表由原子數據或復合數據組合的集合,並可在多個業務場景中被重復使用。語義上獨立的數據表是由以上三者組合而成的集合。

這個是數據模型成果之一,模型產出物,包括公共類、有品種屬性、主體分類和財務主表,還有包括交易、監管和披露。從邏輯模型看,行業屬性代碼,然后是六類機構。數據模型的成果之二就是模型管理平臺,我們現在做了一個自動化的模型管理平臺,這個平臺具有很強大的功能,可以采集數據,這個數據是通過檔案形式,包括excel表以及特定的檔案形式錄到數據庫,在入庫當中也有檢查的。現在做標準化工作,以前標準化工作是這么做的,哪個機構想做標準了提出申請給證標委,證標委覺得可以,然后請證標委所有委員審議,委員沒有意見就做標準。標準不會做任何參考,我自己有哪些數據項列完以后就去做。另外的標準流程也是這么做。現在進行對比會發現,這兩個標準之間,同樣的數據項定義不一樣,英文標識不一樣,很難進行借鑒。這是我們證標委中重大的問題。為什么要搞數據模型,就是要把數據統一,原子數據統一。以后制定標準,標準化工作組先到數據庫當中,到模型管理平台中看,我所要定義的數據項在數據庫里有沒有,有的話就直接接入,沒有的話就自己新定義,定義完了以后新的數據項入庫。這樣就能夠使行業的數據做到同一個數據項是唯一的,描述完整的。這個引擎還可以進行全文檢索,里面有相關的系統參數設定、日志審計和數據到處等等。這個過程包括采集過程、評審管理、模型展示,里面包括頂層流圖還有檔案方式,因為將來還會有一些表格在里面。這個版本也經常在更新,現在模型管理平臺是1.0版本,后面馬上要搞2.0版本。尤其是以后通過網站,現在有中國證券期貨資訊網,大家以后在制定標準過程中,或者在其他的工作中都可以上這個平臺進行查詢。

為進一步劃分多視角邏輯模型,這個是“1+6”的方式。這個是數據模型服務行業標準化,前期的編制,中期的評審和后期的發布,通過這三個步驟。模型現在在進行第二期的工作,第一期大部分的數據都已經理出來了,下面第二期的工作結合新的資訊披露,現在很多新的業務推出,所以新的模型也要加入進來,新的數據要進行收集。同時第二期工作主要是把邏輯模型向物理模型轉換,同時還要寫一本書,在國內要組織行業內的宣傳,和一些廠家進行溝通和交流,最後來進行推廣。

機構間介面標準是以行業內的數據通信協議應用指南為依據,從業務類別、報文類別、數據類別、傳輸類別四個切入點進行分析歸納。在這里有一個分類,從交易、結算、資訊披露、監管報送、行業間以及其他,我們用了比較多的fix、ftd,結算是iso20022,資訊披露是xbrl。現在行業內主要的國標是xbrl系列,現在有5個國標。現在這一塊還在做通用數據交換標準,現在是剛剛立項。機構內的數據交換,對機構來講意義是非常重大的,現在每個機構可能有幾十套系統,少的十幾套,多的幾十套系統。機構內部的系統如何進行數據交換也非常重要。很多機構是自己開發、自己做的話確實力不從心。所以在這一塊證標委也做了大量的工作,我們也搞了相應的交換機構。這是企業內部的資訊交換總線,通過建立機構內部數據交換平臺達到數據統一交換標準。

資訊披露在現在資本市場中是相當重要的,將來注冊制主要是以資訊披露為主,今後對上市公司,對經營機構的監管事中事后監管也是以資訊披露為抓手。所以我們行業的資訊披露,現在的數據量大,種類繁多,包括數據模型制定也花了大量的精力和做了大量的工作。資訊披露的業務范圍也有分級,有向公眾披露的資訊,有向監管機構、自律組織披露的資訊,也有向特定對象披露的資訊。我們現在這個階段做的是物、分類等公共部分,基金資訊披露,上市公司和非上市公司資訊披露和股票發行注冊的資訊披露。股票發行注冊這塊滬深交易所在做,所以這塊的資訊披露工作正在收集,到底要披露哪些內容,兩個交易所也制定了很多指引,在資訊披露上兩個交易所都制定了十多個指引。資訊披露的方法論,通過對應、提煉、重組和回歸,經過多次迭代以后形成最終的資訊披露數據模型。

未來工作展望,行業基礎編碼類要跟蹤行業基礎編碼方面的最新發展態勢,按需修正基礎編碼體系規劃,規範相關標準的制定工作。行業數據模型還是要進一步梳理形成業務全覆蓋的抽象模型,針對六大用戶視角梳理邏輯模型,繼續建設行業數據治理平臺,推進模型應用,支援中央監管資訊平臺建設,中央監管資訊平臺我多介紹一下,這個監管資訊平臺歷時三年左右的時間把行業內所有的數據報送,所有的監管工作都放在這么一個監管資訊平臺上。所以數據治理最開始要做的想法就是要支援中央監管資訊平臺,這么大一個平臺,包括證監會幾十個部門,包括十幾家核心機構,包括幾百家經營機構的數據都要匯總到這個資訊平臺里面,而且這個資訊平臺有很多監管職能,所以一定要做到數據統一。另外是為行業標準提供素材和審核,數據模型推廣和國際化。機構間介面標準未來有這么多的任務,我就不一一贅述了。機構內介面標準從五個域來進行標準的制定工作。行業資訊披露主要做的包括新會計準則的對接,股票公開發行注冊制資訊披露模型,私募產品資訊披露模型,還有一些其他的。

總體來講行業數據治理工作對我們行業來說意義非常重大,它首先把數據進行收集,然后歸類,然后模型化。其實對我們行業來講,大數據的應用現在還為時過早,因為我們行業的數據主要是結構化數據,非結構化數據不是很多。但是行業數據的收集、治理工作也非常重要,數據不斷地收集,達到一定的量,通過幾十年的數據收集,我們能從中得出很多有價值的,可以利於我們未來發展的很重要的資訊。所以這個工作是一個持久的工作,對每個機構也相當重要,機構自己的客戶數據、經營數據如何更好地保存和應用,都是未來發展技術支援業務發展一個非常重要的抓手。我們在這方面工作,整個行業來講工作做得還是不夠的。這一兩年證標委首先先帶動整個行業的數據治理工作,也希望大家能夠積極參與到這個工作中來,尤其對自己機構內部的數據如何妥善地保存和利用,可以借鑒上述這些方法。這些方法也不一定是完全準確和正確的,我們在不斷地編制模型過程當中,把模型應用到實際工作中也會糾正之前的一些偏差,不一定是完全正確的。但是在目前現階段來講可能還是比較有效的。所以今後也希望大家對我們這個工作多提寶貴意見,多多參與。我今天就介紹到里,謝謝大家!

【免責聲明】本文僅代表作者本人觀點,與本網站無關。本網站對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,並請自行承擔全部責任。

(本新聞來源:和訊網)

文章標籤


Empty