menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

時事

中國人壽數據中心解密:雙活部署備份 自動運維工作

鉅亨網新聞中心 2013-12-02 10:06


金融界網站訊 11月28日,中國人壽保險股份有限公司(以下簡稱“中國人壽”)2013年全球開放日活動在上海開幕。中國人壽資訊化基礎建設的重大成果——中國人壽數據中心(卡園)在活動中首次亮相,中國人壽數據中心副總經理華偉對金融界保險頻道表示,中國人壽數據中心為了保證數據的安全,根據數據分類實施了相應的備份措施,整體上每天進行一次備份。中國人壽還將建立災后備份數據中心,一旦上海發生重大災難,即便公司停止運營,也能保證數據的安全和完備。

中國人壽數據中心總經理趙立軍還向金融界保險頻道介紹了上海數據中心的節能環保措施以及未來發展情況。


數據中心對於保險公司猶如心臟對於人體一樣重要,高安全、低成本、高效能的數據中心是保險公司穩步發展的有力保障。中國人壽保險股份有限公司堅持走符合自身業務特色的IT發展道路,立足雙活、綠色、自動化的動態基礎架構,滿足業務連續性和靈活性需求,提高服務滿意度,追求風險可控和可持續發展。通過打造智慧高效的數據中心,為公司提供隨需而動的資訊服務,充分發揮科技創新的先導作用,引領公司全面發展。

一、 構建先進適用的技術體系

網絡扁平,高速接入

隨著“云計算”時代的到來,網絡大升級已成為金融行業的必然趨勢。面臨快速增長的數據流量,簡單地提高服務器、交換機之間的速度,已不足以優化網絡效能。2011年至2012年,中國人壽成為行業內率先完成網絡扁平化改造的單位之一,將過去的多級接入方式改成各級機構、網點、各移動終端與IT資源池的直連,實現了小前端與大后臺之間高效、便捷的連接。

圖1網絡扁平化項目目標

圖1網絡扁平化項目目標

網絡扁平化改造讓公司舊有網絡狀態轉化為契合云計算的“云架構”模式,從而徹底打破區域限制和層級阻隔,降低網絡運營費用,大幅提高工作效率,為成本優化與資源調控和新技術的應用打下了堅實基礎。一是降低了樹狀結構下多級節點帶來的連鎖反應。單個節點的增減/變動不再影響其他節點,極大地增強了網絡的擴展性。同時,由於減少了網絡的中間環節,全國50%以上的基層節點延遲得到了顯著改善。二是統一規範的扁平化網絡架構,為各類新技術的應用提供了必要的網絡平臺。通過扁平化網絡搭建的業務云,系統各級網點以及移動終端可以靈活、快捷和高效地使用部署在云中的軟硬體資源。

雙活部署,業務永續

“雙活”數據中心是指兩個數據中心同時投入運行,互為備份。該項技術是近年來企業IT災備領域興起的新技術。與原有的只有當生產中心癱瘓時,災備中心才啟動的“生產+災備”模式不同,“雙活”中心的切換時間更短,有利於提升業務連續性;能降低備份資源的閑置率,有利於加快業務處理速度、提高資訊資源運用水平和IT設備利用率。

目前,我們主要依托北京朝陽門機房作為異地災備機房、上海卡園及集電港機房為同城雙活機房,以“雙活+災備”為原型進行過渡性災備體系的建設,實現主要業務系統同城第六級、異地第五級災備,並實現部分災備環境的增值服務。很快,我們將把數據中心(卡園)和同城備份中心(集電港)建成同城雙活中心,共同承擔生產任務、且互為備份。雙活及未來的多活數據中心能有效提升數據中心的計算能力、存儲能力和服務能力,這為利用數據資源和技術創新推動產品創新、銷售創新、服務創新和管理創新創造了條件。

數據中心(卡園)和同城備份中心(集電港)建成同城雙活中心

數據中心(卡園)和同城備份中心(集電港)建成同城雙活中心[NT:PAGE=$]

虛擬資源,提升價值

隨著業務對IT的依賴性越來越強,數據中心需要不斷擴充IT資源容量來滿足需求。如何降低系統成本、提高系統資源利用率、降低管理成本,如何提高安全性和可靠性、增強可移植性等技術挑戰使中國人壽數據中心加大了對虛擬化和云計算技術的研究和引進,在IT基礎設施快速擴張的背景下,積極規劃實施虛擬化“云團”。

圖3 云計算實現三部曲

圖3 云計算實現三部曲

中國人壽數據中心通過虛擬化技術,整合各類硬體資源,形成動態共用的服務器、存儲、網絡以及應用的資源池,提升資源利用率,降低系統部署成本和運維管理成本。一是在不影響業務的情況下使用零星的可用資源。如CPU需求與實際占比可達3:1甚至更高;服務器設備將從專屬資源向通用基礎性資源轉變,設備使用更加靈活。二是通過虛擬化技術,大大降低單臺物理設備故障對整個應用系統帶來的可靠性影響。三是通過資源池化,無論業務部門何時提出需求,都保證有可用容量,並且交付資源的過程可以標準化、便捷化。四是因為能更集中、自動地管理更少的設備,所以能減少耗電、運維管理等成本。

自動運維,靈活服務

自動化技術是通過資訊化的工具替代手工操作處理數據中心的各類資源供應、應用系統部署、升級和設備巡檢等工作的技術。數據中心正逐步實現現有運維工作的標準化、自動化、集中化,有效降低人力成本,提升運維工作效率及操作準確性,快速準確地響應業務需求。

圖4以服務為中心的服務運維平臺

圖4以服務為中心的服務運維平臺

通過實施運維自動化,數據中心系統管理員人均管理服務器的數量可由手工管理100臺提高到自動化工具管理500~1000臺;借助自動化,可以管理海量的物理/虛擬服務器,為應用系統向X86平臺轉換,減少設備成本打下扎實基礎;通過將自動化管理平臺與流程管理、監控、設定管理平臺整合,可以實現從審批到操作的全流程打通,實現運維操作與系統后臺隔絕、全程日志記錄的高安全性。

?

集中監控,快速響應

為了保障數據中心各應用系統的穩定運行,確保故障發生時能夠及時準確地定位問題,有效緩解運維壓力,數據中心開展了應用系統監控工作。

目前,我們已實現對各類IT資源(包括36家省級分公司)7*24小時的資源監控、故障監控、效能監控及綜合分析監控。包括:主要應用系統和所有運行主機的基礎平臺監控(操作系統、數據庫、中間件等);核心應用系統和生產主機的應用監控(進程、(通信/連接)埠、日志)。

圖5 IT監控平臺系統架構圖

圖5 IT監控平臺系統架構圖

為了更好的發揮IT監控平臺的功效,數據中心將從應用日志改造入手,實現應用日志的監控,並以卡園和集電港雙總控中心兩套監控平臺互為監控、互為監督、互為協作,確保“雙活”中心的安全性、可用性。[NT:PAGE=$]

綠色高效,節能減排

中國人壽作為具有社會責任感的企業,在數據中心的建設方案中充分考慮了節能減排技術。在保障安全可靠的前提下,大膽采用綠色節能新技術,使數據中心的設計PUE值控制在1.6以下。(PUE是國際上通用的數據中心能源使用效率衡量指標。PUE=總設備能耗/IT設備能耗,PUE越接近1表明能效水平越高。卡園數據中心PUE的設計值低於目前國內同行業和世界同緯度數據中心平均值)。

圖6 數據中心機械空調系統

圖6 數據中心機械空調系統

通過提升冷凍水溫度,將冷凍機的運行效率提高了8-13%;采用冷凍水二次泵變頻驅動,實現了冷凍機在機房設備安裝數量較少、小負荷變化時的充分節能。按照上海氣象統計數據計算,冷卻系統每年可以利用自然冷卻的時間達到26%。

精密空調采用下沉式的電子直流(EC)風機,本身就具有變速節能特點;而下沉架空地板的設計,可減少送風余壓損失。根據在美國第三方實驗室ETL的測試結果,對比常規EC風機安裝方式,節能效果達到20%以上。

優化機房的冷熱頻道版面,進行冷熱頻道全隔離,減少無效回風和冷熱氣流混合,可以提高送風溫度。同時,獨立的新風系統統一完成除濕,各機房區域的膜加濕設備完成加濕,從而減少冷凝和空調的運行負載,達到減少冷凍機組加濕負荷和制冷負荷。

二、 構建成熟完善的服務體系

統一服務,模式創新

在公司全面實施“創新驅動發展”戰略的大背景之下,中國人壽數據中心立足自身發展規劃,創新性地開展“資訊服務體系建設”工作,充分發揮國壽資訊的比較優勢,構建完整的資訊服務框架,全面梳理歸類資訊服務內容,建立服務目錄,規範服務流程,實現統一受理、處理標準、主動服務,全面提升響應能力和服務滿意度。

IT服務目錄是通俗易懂的IT服務菜單,用來回答用戶“資訊技術部門能夠給我提供什么”的問題。通過IT服務目錄,用戶可以清楚了解資訊服務的內容和承諾。經過全面梳理歸類資訊服務內容,數據中心建立起面向業務部門、資訊技術部門和最終用戶的三層視圖的IT服務目錄。數據中心依據不同的用戶類型,對IT服務目錄進行適應性客製並裝載入IT服務工單系統,形成兼具標準化及個性化的統一服務入口。

與此同時,資訊服務體系在全國36家分公司建立了管理集中、模式統一的實體服務臺,負責IT服務請求的統一受理、標準化處理、督辦和回訪分析。依托IT服務臺運作,數據中心可以全面掌握用戶的資訊化需求、應用系統的運行狀態及相關的業務運作情況,完成全域性資源或狀態的匯集。從而把分散在全國36個省市、人員規模達到1500余人的資訊隊伍,從以“機房設備與系統”為中心的資源依托模式,轉變成以“IT服務臺”為中心的服務支援模式,充分發揮公司IT條線專業化分工協同的規模效應,將IT資源的集中優勢轉化為客戶服務、業務拓展和風險管控的利器,真正做到“服務入口統一,服務主線明晰、服務幅度變大”。

圖8資訊服務體系建設框架

圖8資訊服務體系建設框架

服務質量,自我完善

ISO20000體系標準以ITIL最佳實踐為基礎,是全球第一部最具國際影響力的IT服務管理體系標準規範。數據中心密切結合自身實際情況,充分調研分析IT服務質量管理的內在需求,著力於將國際標準本土化和落地化,並於2012年正式通過ISO20000貫標認證。與常規貫標工作不同,數據中心ISO20000貫標與認證有效解決了企業內部標準與行業最佳實踐、國際標準相互銜接和融合的問題,摸索和建立了一套適合中國人壽自身特色的IT服務質量管理體系,並通過PDCA質量管理方法,推動體系的持續改進和提升。數據中心原創編制的《ISO20000質量評估手冊》,包含200多項關鍵控制點和檢查項目,對於日常的服務質量管理工作具有較強的實踐指導作用。

同時,數據中心基於資訊服務體系運作經驗,不斷優化服務流程、完善作業指引和豐富配套工具,不斷優化檢查標準及檢查方式,並研究適用於公司的資訊服務質量測評與管理機制,全面提升中心的IT服務質量管理能力。

圖9. ISO20000國際標準認證證書

圖9. ISO20000國際標準認證證書

圖10.ISO20000文體體系

圖10.ISO20000文體體系?[NT:PAGE=$]

總控中心,智慧中控

數據中心總控中心(簡稱ECC)是一個匯聚了人員、流程、技術的邏輯及物理的場所,用來管理支援企業運轉的資訊,是數據中心的“眼睛”和“大腦”。依托ECC,數據中心已建立起7*24小時現場值班、每日生產例會、應急響應演練等生產保障機制,實現了對各類IT基礎資源7*24小時的綜合監控和快速響應保障。

新落成的卡園ECC將穩步實現“監、管、控、調、運、檢”職能。通過應用先進技術和30塊大屏的物理設施,全面及時呈現監控內容,為調度管理和運行控制提供數據支撐;通過強化執行規章制度,將ECC打造成遵循“標準”執行的“營盤”,對外提供值班管理、訪問控制、應急指揮、監控管理、熱線支援等十項服務,讓ECC成為數據中心的“雙手”;結合智慧化的ECC中央控制平臺,不斷深化對資源的應用,最終建成綜合性智慧化指揮控制中心。

圖11 ECC整體功能視圖

圖11 ECC整體功能視圖

 

數據服務,更為精準

隨著“大數據”時代的來臨,數據已成為公司的戰略性資源。打鐵還需自身硬,數據中心立足自身運營數據,加強對數據的綜合管理與應用能力。數據中心已構建涵蓋8大模塊、包含約900條指標的運營指標體系框架,並通過落地、跟蹤、分析和改進運營指標,為中心運營管理提供抓手。后續,數據中心將有效發掘公司數據的“金山”,為業務部門提供更有價值的數據分析結果,從而為市場細分、業務創新提供有效的指導;在持續提高數據質量的同時,探索研究“利用災備資源拓展應用服務研究”等創新課題;將借助雙活/多活數據中心的計算能力與數據倉庫海量數據的處理能力,建設公司大數據分析平臺,為公司商業智慧應用、業務發展與決策提供數據資訊支撐。

三、 鑄造堅固完備的安全體系

數據中心始終把資訊安全作為中心運營的“生命線”,按照公司資訊安全體系架構統一規劃,遵循“外強防御、內重執行、全面布控、查漏補缺”的資訊安全工作規則,實施資訊系統等級保護檢測、對標國內外先進的資訊安全管理規範,持續客觀衡量和整體提升中心的資訊系統安全管理水平。

圖12 資訊安全體系整體框架

圖12 資訊安全體系整體框架?

覆蓋全面的安全技術工具

從2005年以前僅具備防火墻、防病毒軟件和防病毒網關,發展至今,數據中心已基本具備了入侵檢測系統、上網行為管理系統和統一身份管理系統等10個安全系統,提供了網絡接入的入網安全檢查、網絡安全域漏洞掃描、系統上線安全檢查、統一身份管理、防病毒等方面的服務,大幅度提升了資訊技術生產運營服務的安全保障水平。

職責明確的安全管理組織

建立了由資訊安全領導小組、工作小組和專項小組組成的資訊安全管理機制:由資訊安全工作小組負責組織協調工作,構建了資訊安全領導小組統籌規劃,工作小組齊抓共管,安全專項小組協調聯動的資訊安全管理機制,做到組織、人員、責任到位,進一步加大了資訊安全管理力度,加強了資訊安全工作的整體性、及時性、協作性,為資訊安全工作提供有效的組織保障。

扎實有效的安全防控措施

一是聚焦資訊技術生產安全,開展資訊安全專項檢查工作,落實整改措施,消除安全風險;二是持續跟蹤和分析緊急事件,分析事故原因,形成整改措施,並監督整改措施落實情況;三是通過實戰演練和沙盤推演模式開展應急演練,優化緊急事件處理流程,提高數據中心緊急事件處理能力;四是通過有計劃、有步驟、多層次、寬領域的培訓,強化員工技能,提升安全意識,切實做到資訊安全工作常講常議常抓不懈。

高安全高可靠的基礎環境

數據中心機房實現了嚴格的安全分區:有人區/無人區分離;人流/物流分離;分層次的安全劃分:在一級防護區域采用掌紋等生物識別技術和單一防尾隨出入頻道等手段嚴控非法侵入;園區內實行全方位的攝像監控。安保巡更、獨立的監控室和總控中心全部實行7×24的值班,對機房和配套區域以及設備運行情況進行嚴密的監控。

文章標籤


Empty