<xmp id="0c8o0">
  • <nav id="0c8o0"><code id="0c8o0"></code></nav>
    <menu id="0c8o0"><tt id="0c8o0"></tt></menu>

    金融業如何進行數據驅動運營?

    本文是中原銀行大數據架構師劉遠東發表了題為《中原銀行數據分析建設實踐》的演講,內容很有啟發,特整理分享如下。

    金融業如何進行數據驅動運營?

    一、中原銀行大數據建設歷程

    金融業如何進行數據驅動運營?

    中原銀行這幾年在數據方面做過很多探索:

    • 2016 年 12 月,中原銀行完成了大數據第一期項目上線;2017 年 5 月,完成了全行數據集市重構與遷移;2017 年 7 月,上線了基于新的數據平臺的自助分析;2017 年 10 月,開始使用外部數據平臺和歷史數據平臺;
    • 2017 年 12 月,正式與神策數據合作接入實時行為分析平臺;
    • 2018 年 5 月,中原銀行完成了兩個新項目——數據挖掘分析和一站式數據訂閱平臺的上線;
    • 2018 年 6 月,中原銀行上線了一批新的 T+0 數據集市。

    個人認為,銀行業經過了做報表到 BI 的階段,下一個發展階段很可能是場景化,比如實時行為分析,T+0 的 OLAP 系統,且 T+0 是個必然趨勢,可能幾年后倉庫都會變成 T+0,很難再有人接受 T+1 的場景。

    注: T+0 是一種證劵(或期貨)交易制度。凡在證劵(或期貨)成交當天辦理好證劵(或期貨)和價款清算交割手續的交易制度,就稱為 T+0 交易。

    T+1 是一種股票交易制度,即當日買進的股票,要到下一個交易日才能賣出。“T”指交易登記日,“T+1”指登記日的次日。

    二、平臺建設目標與思路

    金融業如何進行數據驅動運營?

    中原銀行已將大數據治理與應用建設上升到全行戰略層面,并制定了以技術創新為導向,秉承自主可控、開放共享的理念,構建統一完整、便捷高效、智能安全的大數據技術體系,提供全流程、一站式、智能化的數據服務的目標。

    值得強調的是:中原銀行一直以來的目標不是做一個系統,而是為了提供一種服務。比如:當業務人員想知道流失了多少客戶,就目前來說,很難提供給他 BI ,即使提供了數據,他也很難算出來,但通過場景化分析,制定出該場景下所需要的維度和指標,通過調取相關數據,很容易進行分析。因此,我們計劃把一個場景做成服務,未來提供給業務團隊使用。

    三、數據平臺建設進展與規劃

    金融業如何進行數據驅動運營?

    這是中原銀行大體的平臺建設進展情況:

    • 2016 年已完成基礎平臺搭建和數據架構的設計;
    • 2017 年建立了一個數據整合平臺,構建了數據服務引擎、OLAP 自助分析引擎和挖掘分析平臺的基礎搭建;
    • 2018 年計劃做數據治理、實時計算服務、圖計算服務、數據交換平臺、機器學習平臺等;
    • 2019 年,我們可能會從技術角度出發,做一些更加整合類的、更加完善類的、提升類的項目。

    在很多情況下,雖然科技部門領頭建立了技術體系,但并沒有真正的業務落地,現在我們在嘗試往實現業務跨越發展的方向轉移。

    在 2018 年 6 月,中原銀行特別成立了一個一級部——數據銀行部,這是從信息技術部分離出來的一個部門。

    以前我們更多地專注于技術,但現在意識到用技術驅動業務,在營銷和風控方面的成本和難度都非常高,且技術并不一定能驅動業務帶來收益,從這一點上,我們決定嘗試神策數據提供的這一套場景化的方法論和邏輯。

    中原銀行在過去幾年做了一些技術驅動的改進,比如:面向全行的集中交付能力優化,包括固定報表和移動報表,自助查詢模型等,特別是在過去幾年銀行業的自助查詢比較流行,沒有做的銀行未來也一定要做,這是一個必經的階段。

    四、數據分析需求理解:五種模式支持全行應用

    金融業如何進行數據驅動運營?

    我認為銀行業的數據分析需求可能有五種場景的數據交互模式(如上圖),中原銀行目前做了一個數據實驗室,其實是一套數據湖的系統,就是把以前的倉庫、集市這些平臺遷到了一個新的計算架構上面。

    它的主要作用是為了做數據建模和探索性的分析,該平臺完全獨立于原來的 P2P 平臺,且不像以前那樣只做報表,也能做一些自助分析、數據建模,以便將來能支持更多建模師的使用。

    我們希望這種項目出來成果之后,能做成不同類的業務場景應用。不過,有些舊有模式,比如:即席查詢在中國視角下會一直存在,因為很難從別的應用場景完全替代它。

    五、數據分析平臺體系建設

    金融業如何進行數據驅動運營?

    中原銀行目前規劃了一套數據平臺體系,但目前這個體系還在演進。

    在過去幾年,中原銀行大概做了將近 1000 張報表、20 多個主題的自助分析以及數據實驗室的平臺。

    這些平臺面向的人員有所不同,報表主要面向數據使用人員。自助分析主要面向條線,比如:給領導編制報表和往下發布數據的人;數據實驗室主要面向一些有科技背景的人員,比如:建模師。

    除了上述三大平臺,中原銀行還建立了一個社區平臺,我們把這些統稱為一站式分析平臺。

    數據驅動創新社區的建立是為了引領行業數據驅動的發展,目前,科技部正在主導這個社區的建設。

    我們會在該社區大量地發布一些數據驅動的內容,比如:數據分析報告、文章等。個人認為,像數據驅動這種工作的推動,將來一定是業務牽頭的,因為即使技術人員有思路也很難達到盈利,所以需要站到業務角度上去實踐。現在,我們會把自己的技術人派遣到業務部門,學習在業務場景下進行分析。

    前面提到的這幾種數據分析平臺還是比較偏技術方向,不過我始終認為,未來一定是場景化的方向才有發展。因為場景化的成本更低,比如:更低的使用成本,場景化讓業務人員使用更方便;更低的人才成本,場景化的應用不需要招很多技術人員。

    六、面向大數據的綜合分析平臺架構

    金融業如何進行數據驅動運營?

    這是中原銀行目前面向大數據的綜合分析平臺架構,在這方面各行差異不大。

    不過,中原銀行集市做的很薄,只有一個貼源的 ODS,以及 4-5 塊集市,比如:管會、內部運營、營銷等,與其他銀行相比,中原銀行是一個非常輕的架構,從貼源可以直接到集市,有的集市甚至沒有指標加工,就直接整合明細,再到自助分析、報表,有的也往實驗室里面供。

    個人認為:像自助分析和場景化分析、數據湖這樣的思路早晚會替代我們之前做的大量報表,T+0 會替代 T+1,這只是時間問題。所以,我們整個架構現在也在往這邊遷移。

    七、分析平臺建設實踐—性能優化

    金融業如何進行數據驅動運營?

    在前幾年中原銀行對分析平臺做了一些性能調優,一般剛開始從報表轉到 BI,肯定會面臨性能問題,因為 BI 本身是一種以空間換取靈活性的方式。

    我們采用大數據技術支撐計算,用了 30 個物理計算節點,大概有二三十個面向大數據反范式設計的主題模型,也就是寬表模型。因為寬表模型犧牲了很多空間的代價,在這個大數據的平臺上一般會跑得比較順,冗余度高一點,性能會提高。

    不過,大數據平臺的一個主要特點是成本較低,擴容方面也可以接受,所以我們現在更多選用這種方式。

    八、分析平臺建設實踐—質量提升

    金融業如何進行數據驅動運營?

    數據質量提升,是中原銀行今年的重點,我們準備啟動一個新的數據治理項目。

    下面簡單介紹下:

    我們建設了一個在線口徑管理的渠道,舉個例子:現在業務在看報表發現數據問題的時候,會有一個線上的渠道直接在上面反饋問題,之后會有專門的技術人員跟進。除此之外,我們還有一個類似知識庫的渠道,該渠道有利于口徑的沉淀。但是,對數據的治理,比如主數據、標準管理,我們還需要進一步完善。

    九、分析平臺建設實踐-靈活性提升

    金融業如何進行數據驅動運營?

    這個是中原銀行的 BI 平臺,總體來說使用還不錯。我認為銀行到一個階段必須做 BI,如果沒有 BI 很難把數據驅動的思路真正地讓業務落地,因為業務人員無法直接接觸數據,很難了解數據在未來的作用。

    只有他們把 BI 用熟了之后,你才能告訴他以后可以做場景化分析和預測類分析,現在中原銀行就是沿著這樣的軌跡發展。

    十、分析平臺建設實踐—數據安全管控

    金融業如何進行數據驅動運營?

    金融業會涉及很多敏感數據,特別要注意數據安全問題,為了保證數據安全,我們做了一些技術上的加工。

    比如:

    • 下載管理,我們建立了完善的數據使用審核流程和設定了數據最小訪問授權,按需分配報表訪問權限;
    • 實時脫敏,Smartbi?支持不同形式的數據脫敏展現,可以實現前臺敏感信息的脫敏展示,對像身份證號這樣的敏感數據在實時展現時會隱去;
    • 使用痕跡的管理,我們會統計發布報表訪問數據,促進報表使用過程中的自我監督和相互監督,便于及時發現因崗位調整,多余授權帶來的數據泄漏風險;
    • 行為監控,我們利用大數據與機器學習技術,建設數據安全智能分析預警平臺,對數據操作行為進行智能化監控,防范內部數據安全事件。

    十一、未來建設規劃—數據深度探查服務體系

    金融業如何進行數據驅動運營?

    我們的未來建設規劃大體如上圖,目前來說,我們還處于數據探索和多維分析階段,在今年我們啟動了幾個數據建模項目,下面列舉一二。

    我們啟動了一個叫做網點的現金流預測項目,要做到精準預測,需要考慮到很多維度,比如:網點的維度、人員的維度、客流的維度、天氣的維度。

    因此,這個項目通過分析研究所有網點的歷史數據來預測各支行每天需要多少存款,這里的存款指的是現金。因為對支行來說現金的存量是個非常大的成本,比如:運輸成本,而且現金沉淀到支行沒有利息,相當于現金放那兒了。

    我們希望預測類的項目在明年會有一些階段性的成果出現,也希望通過我們在數據驅動變革創新方面的努力,能為推進金融業數字化轉型建設發展進一份力。

    總結

    金融業的競爭已經愈加激烈,不變則敗,盲目的變亦敗,唯有數據驅動能指引方向。

    希望本文對金融業的運營與產品有啟發!

    本文為@運營喵原創,運營喵專欄作者。

    (0)
    運營喵運營喵官方
    上一篇 2018-08-31 21:31
    下一篇 2018-09-01 21:29

    發表回復

    登錄后才能評論
    公眾號
    公眾號
    返回頂部
    運營喵VIP會員,暢學全部課程,點擊查看 >
    央视频直播在线直播