基於資料倉庫技術的保險業統計分析系統設計論文

  保險業是指將通過契約形式集中起來的資金,用以補償被保險人的經濟利益業務的行業。以下是小編今天為大家精心準備的:基於資料倉庫技術的保險業統計分析系統設計相關論文。內容僅供參考,歡迎閱讀!

  基於資料倉庫技術的保險業統計分析系統設計全文如下:

  摘 要:通過分析保險行業的核心業務,採用資料倉庫技術,對保險企業中的海量歷史資料進行整合和統計分析,得到精確的業務執行分析報告,對業務及客戶進行趨勢分析,以便及時作出正確決策並根據自身需要監測業務運營。

  關鍵詞:資料倉庫;保險業;ETL;多維資料;統計分析

  1 資料倉庫簡介

  資料倉庫***Data Warehouse,DW***是隨著關係資料庫、並行處理和分散式技術的飛速發展而產生的[1], W?H?Inmon出版了《Building the Data Warehouse》一書,給出了資料倉庫的定義:資料倉庫是一個面向主題的、整合的、非易失的、隨時間變化的用來支援管理人員決策的資料集合[2]。資料倉庫包含的是整個企業檢視的粒度化資料。

  資料倉庫系統通常對多個異構資料來源有效整合,整合後按照主題進行重組[3]。存放在資料倉庫中的資料通常不再修改,用作進一步的分析型資料處理。

  資料倉庫系統的建立和開發以企事業單位的現有業務系統和大量業務資料的積累為基礎 [4],其開發是一個迴圈迭代過程,通常需要企業有一定的業務資料積累,開發人員將這些歷史資料通過ETL輸入到資料倉庫中,進行分析和統計,以建立決策支援輔助系統,為企事業單位管理者提供決策支援。

  2 保險業需求分析

  隨著保險業發展及保險市場競爭的加劇,保險公司在管理和運營方面面臨著更高的要求,來自監管、競爭、技術更新及全球化等各方面的壓力不斷考驗著保險企業。保險業發展的核心動力表現在以下幾個方面:①進入新分市場及提高業務質量;②鞏固客戶忠誠度,適應客戶多變的需求;③高效的運營;④精確的風險及成本控制;⑤消除各種技術壁壘。

  要做到上述目標並不容易。對高層管理者來說,由於統計口徑的關係,很難獲取一致性資料進行比對,很難及時監控到業務狀況,不能有效地進行決策支援。對於業務部門主管與業務分析員,所需報表難以及時獲取,即使取得的資料也難用於多視角、全方位地分析業務問題。對於IT部門來說,要不斷幫助業務部門製作報表,時間相對較長,而且開發的報表越多,特別是分析型的報表越多,業務系統性能越受影響。

  以某人壽保險有限公司為例,該公司的資料支援情況如下:

  ***1***保單管理系統中大致有50張左右的報表在執行,但隨著公司業務的發展,資料分析及用於日常管理的制式報表與日俱增,報表數量將很快無法滿足業務發展需求。

  ***2***各業務管理部門有各自的制式報表及統計需求,但在將資料彙總時,時常出現因統計時點不同、指標定義的理解差異等原因造成資料不一致,導致額外的資料校驗工作。

  ***3***當前報表的IT實現基本上是按照單個報表需求來設計的,造成IT設計無法複用,報表開發缺乏整體規劃,呈一種臨時性狀態,隨著報表及統計需求的增加,IT相應的工作將與日俱增。

  ***4***因當前報表及資料統計都在保單管理系統中執行,隨著需求數量的增加,保單管理系統將面臨沉重的夜間批處理壓力並嚴重影響日間日常業務操作的效率及穩定性。

  針對上述系統現狀,在建設中決定採用資料建模、ETL、資料分析以及資料展現等技術,實現風險管控分析、客戶服務分析、客戶維持分析、市場銷售分析、綜合分析和綜合管理6大功能,達到以下目標:①代替原有手工報表方式,為業務人員節省時間;②提供精細的分析資料。業績分析可以從營業部,鑽取到營業組,甚至每個FC***理財顧問***,保全分析可以分析每種保全專案的明細;③統一的分析口徑。各部門統計指標,可以在統一的時間點上進行公司級彙總;名稱一致的統計口徑,可以唯一定義一種統計方式;④唯一的報表平臺。從報表需求獲取到報表需求分析以及最後的實現都在一個體系下完成,公司資料分析工作逐步系統化和實用化。

  3 系統設計

  統計分析系統採用靈活架構,在構建一個統一、穩定的企業級資料倉庫基礎上,分步構建各個獨立的分析應用資料集市,滿足靈活性、擴充套件性要求,系統架構如圖1所示。

  保險資料倉庫是一箇中央的知識資料庫,包含來自壽險系統、團險系統、短期險系統和電話銷售系統等源系統的源資料,資料模型分為3層:

  ***1***資料準備層***Staging Layer***: 採用同源系統相似的資料結構儲存源系統的每日增量資料。

  ***2***保險企業模型層***Insurance Enterprise Models Layer***: 作為保險資料倉庫的核心,相應的保險企業模型部署在該層。根據保險行業的業務檢視,保險企業模型分為10個主題,根據保險資訊的特性而非事務處理的目的來設計,企業級上所有保險業務資訊根據歷史版本進行記錄。在資料準備層通過ETL***資料抽取轉換裝載程式***進行資料批處理,採用增量機制裝載進入保險企業模型。

  ***3***分析資料模型層***Analysis Data Models Layer***: 各種各樣的資料分析需求歸類到不同的資料集市,如市場及銷售資料集市、運營效能資料集市、風險管控資料集市等。分析資料模型即為滿足資料集市需求而採用維度建模方法特別設計的模型。分析資料模型從保險企業模型衍生而來,資料通過ETL 批處理,採用增量機制裝載進入保險企業模型。

  ETL採用增量機制,每日從源系統抽取變更資料至Staging層,接著將Staging層資料轉換至企業模型和分析模型。在ETL批處理完成後,系統執行報表批處理生成報表併發布到相應的報表檔案伺服器上。

  OLAP元資料管理工具: 提供OLAP 元資料管理工具,用於管理所有OLAP 業務元資料,包括指標定義、維度層次定義、指標與維度的關係及分析需求。通過使用這個工具可幫助保險企業統一KPI 定義及促進企業標準化管理,同時其管理的內容可作為統計分析系統所支援的知識庫來使用。   OLAP平臺:選擇微軟的SQL Server 2008作為OLAP平臺。OLAP 工具支援分析的型別包括管理儀表盤、平衡記分卡、制式化管理報表、臨時查詢、資料探勘等。

  4 系統實現

  4.1 ETL實現

  ETL採用SQL Server整合服務來實現。Microsoft Integration Services 是一個可以生成高效能資料整合解決方案***包括為資料倉庫提取、轉換和載入ETL包***的平臺。Integration Services包括生成和調式包的圖形工具和嚮導;執行工作流函式操作和執行SQL指令碼等任務;提取和載入資料的資料來源和目標;清除、聚合、合併和複製資料的轉換;管理包執行和儲存的管理服務,即Integration Services;用於Integration Services物件模型程式設計的應用程式程式設計介面***API***。

  4.2 多維資料實現

  建立報表之前,需要通過SQL Server分析建立多維資料模型。之所以使用SQL Server分析服務建立多維模型,主要是為了實現對業務資料的即席查詢。系統開發人員建立多維資料集以支援快速響應,並提供單個數據源以進行業務報告。商業智慧的重要性不斷提高,使用單一的分析資料來源可確保將差異減到最小***如果無法完全消除差異***。

  4.3 報表系統實現

  報表系統實現使用了SQL Server報表服務,報表服務包含一整套管理報表的工具。報表工具在微軟的開發環境中工作,並與SQL Server無縫銜接。通過報表服務,可以從多種不同的資料來源建立各種不同樣式的報表。

  5 應用效果

  該系統目前已經在某人壽保險有限公司正式投入使用,結果顯示,該系統使業務資料的分析效率、分析能力大大提高,在一定程度上簡化了業務人員資料統計工作,對公司決策支援起到很大的幫助作用,系統良好的應用價值體現在以下幾個方面:

  ①資料整合。資料倉庫能夠把來自多個不同子系統的資料進行有效整合,提供統一的、一站式的業務報表系統;

  ②查詢靈活方便。統計分析系統能夠根據不同的需求進行條件過濾,並支援資料向上向下鑽取,資料查詢方式更加靈活,追溯更加簡單直接,為業務分析人員提供了很大的便利;

  ③安全性高。為了保證資料的安全性和可靠性,對資料倉庫中的資料實行統一管理;

  ④降低成本。統計分析系統的建立,可以代替原來的手工彙總操作,一次建立,只需要進行簡單的維護就可長期使用。

  6 結語

  本系統開發及系統執行工作得到如下經驗及啟示:

  ***1***理念的轉變。在資料分析上,需要從清單和簡單彙總上升到資料分析,從單個部門分析到全域性分析,從資料庫到資料倉庫進行分析設計。

  ***2***平臺統一管理要求。在報表的管理上,一個統一的部門管理面向高管的報表,制定統一的口徑;對沒有報表的部門需要嚴格確認資料準確性;對有報表的部門,不要侷限於當前的資料邏輯。

  ***3***系統擴充套件。報表需要不斷擴充套件和改進,不斷提高深度和廣度,收集更多資料,提供更多報表;提升介面功能,精確授權,自動分發報表;提升可用性,全面取代現有的其它報表系統;從明細資料到統計資料,進而分析資料,最終實現商業智慧、資料探勘的目標。