CRM系統:決策樹技術在銀行CRM 中的實證研究
客戶關系管理應用于銀行業是指銀行通過富有意義的交流溝通, 理
解并影響客戶行為, 最終實現提高客戶獲得、客戶保留、客戶忠誠和客戶
創利目的反復循環的過程, 是一種旨在改善銀行與客戶之間關系的新型
管理機制。
對于銀行業來說,如何提供更快速和周到的優質服務吸引和保持更
多的客戶成為各銀行逐利的目標。數據挖掘是整個客戶關系管理中最重
要的組成部分, 是客戶關系管理創造商業價值的關鍵。在銀行CRM中
有效利用數據倉庫和數據挖掘技術,可以為銀行高層決策者提供準確的
客戶分類、忠誠度、盈利能力及潛在客戶等有用信息, 指導他們制定最優
的銀行營銷策略、降低銀行運營成本、增加利潤及加速銀行的發展。
一、決策樹
決策樹技術由于其生成的規則容易理解和可解釋性等特點, 被廣泛
地應用于數據挖掘領域。決策樹由三個基本部分組成: 節點、分支和樹葉
節點。決策樹中的節點是一個測試條件, 這個測試條件將決策樹分為多
個分支, 每個分支代表了該測試條件的每個可能答案, 位于決策樹最頂
端的節點為根節點。每個分支會連接另一個節點, 或者連接決策樹的末
端( 即樹葉節點) , 決策樹建立起來后, 需要預測的數據對象從根節點出
發, 根據所經過的節點的測試條件選擇要經過的分支, 并最終到達樹葉
節點。樹葉節點的值或類別也就是要賦予該數據對象的值或類別。
決策樹可以通過圖形和文字的形式展現出來, 可解釋性大大高于其
他數據挖掘工具, 如神經網絡。建模人員可以通過觀察決策樹的各個節
點來了解數據集合的整體模式, 還可以根據領域知識和正常邏輯來判斷
決策樹的分類是否妥當。當數據挖掘任務是分類記錄或預測離散結果
時, 決策樹更是首選對象。此外, 決策樹比許多其他技術相比需要的數據
準備更少些。因此, 決策樹技術被廣泛地應用到銀行客戶關系管理中。
二、決策樹技術在銀行CRM中的實證研究
我國人口分布特征是約80%的人口為農村戶口, 本文采用的實證研
究數據來源于農行浙江分行某縣級市支行所屬的分理處。該分理處主要
的客戶對象所在鎮的農民儲戶、當地居民、個體經商戶等, 存款額( 個人、
單位、同業存款) 4 億元以上, 貸款2.5 億元左右。
( 一) 數據挖掘任務的提出。在傳統存貸款業務中主要包括三類, 即
個人、單位和同業存款。其中個人儲蓄主要形式是活期和定期等形式, 在
個人存款客戶關系管理中, 由于客戶分散, 數量較多, 利用決策樹技術對
客戶進行分類, 并找出各類客戶的特征, 使其有目標、針對性地開展客戶
營銷活動, 降低客戶營銷成本, 提高銀行新的利潤增長點。
( 二) 用于數據挖掘的數據分析。在客戶關系管理的數據挖掘系統
中, 并不是所有的數據格式都能直接被用于數據挖掘, 一般用于數據挖
掘的數據有以下特點: 一是所有的數據應該放在單一的表格中; 二是每
行應該與一個實體相對應, 例如客戶; 三是帶有單一數值的列應該被忽
略; 四是對每列帶有不同數值的列應該被忽略; 五是對于預言性建模, 目
標列應該被識別, 并且所有的同義列要除去。因此, 必須對數據進行預處
理。
( 三) 數據預處理。數據預處理是從大量的數據屬性中提取出對目標
有重要影響的屬性來降低原始數據的維數, 或者是處理一些不好的數
據, 從而改善實例數據的質量和提高數據挖掘的速度, 包括數據收集與
整理、清理、變換等。數據收集與整理主要是選擇正確的數據源; 數據清
理主要是對數據庫中的異常數據、不相關字段或互相沖突的字段進行處
理。清理的方法包括直接刪除空缺項、人工填補空缺值、使用屬性的平均
值填寫空缺值。數據變換是將數據進行規范化和聚集。規范化可以改進
涉及距離度量的挖掘算法的精度和有效性。聚集是對數據進行匯總。
本例數據預處理分析: 1.數據收集與整理。原始數據有活期儲戶一
覽表和定期儲戶一覽表, 表中有近兩萬個記錄, 其中活期儲戶一覽表中
包括姓名、身份證號碼、賬號、開戶日期、余額、積數等信息。“積數”是指:
以一年為計數單位, 以每年的7 月1 日為基準日, 至統計截止日為止的
儲戶賬戶余額逐日累計的總額, 例: 某儲戶活期賬戶7 月1 日時余額為
1000元, 假設該儲戶賬戶中的余額一直未變, 又假設統計截止日為7 月
8 日, 則該儲戶的積數為1000×8=8000 元。因此, “積數”數額的大小實際
上直接反映了儲戶對銀行籌資貢獻的大小。考慮到儲戶開戶時間的長短
不同,用積數作為預測變量不能正確衡量差異性, 因為相同的儲蓄金額,
開戶時間長的, 其積數一定比開戶時間短的高。因此, 引入“平均積數”來
替代“積數”。平均積數的計算公式為: 平均積數=積數/天數。平均積數的
另一個名詞稱為每戶日均存儲余額,反映的是單戶日均數。定期儲戶一
覽表中包括姓名、身份證號碼、賬號、開戶日期、存款期限、存款金額等信
息。2.數據清理。對近萬個客戶記錄的活期儲蓄數據進行清理, 主要是對
身份證號碼不全者( 有些是實名制前的客戶資料) , 由于存在無法推導其
真實年齡( 性別可根據客戶姓名大致判斷) 等問題, 因此將這部分數據直
接進行了刪除。此外, 還刪除了銀行提供的“積數”為零的值。3.數據變
換。經清理后, 將數據進行必要的變換, 本文確定了用于數據挖掘的相關
屬性共六個: 年齡、性別、存款余額、賬戶使用年限、平均積數和是否定期
儲戶。
( 四) 概念分層
從數據分析可知, 對每列帶有不同數值的列是不適合用于數據挖掘
的。因此, 數據還要進行概念分層處理。概念分層最重要的問題是: 如何
確定一個最佳的分割閥值。
( 五) 決策樹生成過程
根據數據挖掘任務, 將目標變量定為“是否定期儲戶”, 屬性為
nominal, 取值為“0”或“1”, 其中“0”表示不是定期儲戶, “1”表示既是活期
儲戶同時也是定期儲戶。預測變量為: 性別、年齡、使用年限、余額和平均
積數。本文選用C&RT 算法即決策樹分類和回歸算法。該算法是一種完
全兩分類樹型分析法則, 用來方便細分數據以及生成精確的同質性子
集。
( 六) 由決策樹提取出該銀行客戶分類規則
圖1 的決策樹由于不存在過分擬合等情況, 因此, 不需對其進行剪
枝處理, 直接根據上述決策樹提取規則, 以IF- THEN 的形式來表示。對
從根到樹葉的每條路徑創建一個規則。在給定的路徑上的每個屬性- 值
對形成規則前件( “IF”部分) 的一個合取項。葉節點包含類預測, 形成規
則后件( “THEN”部分) 。
沿著根節點到葉節點的路徑, 圖1 的決策樹可以轉換成IF- THEN
分類規則, 如下所述:
1.IF 年齡>70 AND 平均積數<=312 THEN 86.8%的活期儲戶選擇
定期; 2.IF 年齡>70 AND 平均積數>312 THEN 61.8%的活期儲戶選擇
定期; 3.IF 年齡<70 AND 平均積數<=27348.28 AND 余額<=134.51
THEN 3.5%的活期儲戶選擇定期; 4.IF 年齡<70 AND 平均積數<=
27348.28 AND 余額>134.51 THEN 7.5%的活期儲戶選擇定期; 5.IF 年
齡<70 AND 27348.28<平均積數<=38483.12 THEN 21%的活期儲戶選
擇定期; 6.IF 年齡<70 AND 平均積數>38483 THEN 59.2%的活期儲戶
選擇定期。
三、結論與建議
1.銀行活期儲蓄客戶中, 是否同時是定期儲戶這一條件不受性別影
響, 與活期儲蓄賬戶使用年限的關系也不大。因此, 可不必過多地去考慮
儲戶的性別和賬戶使用年限,而跟年齡和平均積數有很大的關系。
2.年齡在70 歲以上的客戶, 同時選擇定期儲蓄存款的可能性極大。
不難分析出, 這部分儲戶的儲蓄的動機主要目的是為了防老。在我國, 尤
其是廣大農村( 本案例的數據提供銀行為縣級市支行下屬分理處, 因此,
其客戶的身份多數是農民和小城鎮居民) 社保體系極不完善, 人們就不
得不進行生老病死等費用的預防性儲蓄。因此, 此類客戶一般是較忠誠
的客戶, 除非等著急用, 一般存入銀行的錢不會輕易取出, 可以把他們歸
為忠誠度較高的客戶。其次, 這類客戶的另一個特點是其儲蓄金額不會
太大, 從本案例的數據中可以看出, 此類儲戶平均定期儲蓄金額為
8576.23 元。究其原因, 此類客戶的收入來源比較單一, 自己已沒有勞動
能力創造財富, 其財富的積累靠平時的節儉、力所能及的勞動以及子女
的贍養積攢而成。因此, 根據此特點, 建議銀行對此類客戶不必投入過多
的營銷費用, 因為他們的儲蓄能力有限。
3.建議銀行關注平均積數的數額, 平均積數大于38483 元的活期儲
戶大部分也會同時選擇定期儲蓄。分析此類客戶的特點, 其一, 年齡在
70 歲以下, 富有勞動力, 平均積數高意味著財富相對較多, 且平均積數
的大小直接與銀行的貢獻率相關。平均積數越大, 其對銀行的貢獻就越
大; 其二, 本案例的數據中可以看出, 此類客戶的平均定期儲蓄金額高達
175632 元, 平均積數高同時也意味著資金流動量大。因此, 根據以上特
征可以判斷出此類客戶屬于高收入階層。其中, 有一些是企業經營者、個
體老板。對于此類客戶, 銀行應把他們列入重點營銷對象進行營銷, 平時
應加強與他們的聯系。采取比對一般客戶更加有吸引力、更加優惠的政
策以牢牢保持住這部分高貢獻度、高收入的客戶。
4.對于平均積數在27348.28 元與38483 元之間的活期儲戶, 其中有
大概五分之一的人會同時選擇定期儲蓄, 根據分析, 此類客戶一般為縣
城中的中低等收入者。對此類客戶建議銀行進行關注, 可作為銀行定活
儲蓄的潛在客戶進行關注, 并應采取一定的營銷策略, 推出各種優惠條
件, 以吸納其儲蓄金額, 為銀行的業務發展作貢獻。
5.對于平均積數低于27348.28 元的活期儲戶, 這類客戶同時存定期
儲蓄的可能性較低, 因此, 可作為一般客戶處理。當然, 在現實生活中我
們亦不難發現, 雖然他們當前對儲蓄的熱情并不高, 隨著收入條件的變
化以及理財方式的改變, 他們依舊是銀行的潛在客戶, 所以, 銀行最好也
能采取相應的措施管理這部分客戶, 為銀行將來進一步開拓市場做準
備。[作者: 浙江經濟職業技術學院]
強力推薦:
天柏客戶關系管理系統
天柏客戶關系管理系統(CRM)是一款集專業性、實用性、易用性為一體的純B/S架構的CRM系統,它基于以客