CRM系統(tǒng):決策樹技術(shù)在銀行CRM 中的實證研究
客戶關(guān)系管理應(yīng)用于銀行業(yè)是指銀行通過富有意義的交流溝通, 理
解并影響客戶行為, 最終實現(xiàn)提高客戶獲得、客戶保留、客戶忠誠和客戶
創(chuàng)利目的反復(fù)循環(huán)的過程, 是一種旨在改善銀行與客戶之間關(guān)系的新型
管理機(jī)制。
對于銀行業(yè)來說,如何提供更快速和周到的優(yōu)質(zhì)服務(wù)吸引和保持更
多的客戶成為各銀行逐利的目標(biāo)。數(shù)據(jù)挖掘是整個客戶關(guān)系管理中最重
要的組成部分, 是客戶關(guān)系管理創(chuàng)造商業(yè)價值的關(guān)鍵。在銀行CRM中
有效利用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù),可以為銀行高層決策者提供準(zhǔn)確的
客戶分類、忠誠度、盈利能力及潛在客戶等有用信息, 指導(dǎo)他們制定最優(yōu)
的銀行營銷策略、降低銀行運營成本、增加利潤及加速銀行的發(fā)展。
一、決策樹
決策樹技術(shù)由于其生成的規(guī)則容易理解和可解釋性等特點, 被廣泛
地應(yīng)用于數(shù)據(jù)挖掘領(lǐng)域。決策樹由三個基本部分組成: 節(jié)點、分支和樹葉
節(jié)點。決策樹中的節(jié)點是一個測試條件, 這個測試條件將決策樹分為多
個分支, 每個分支代表了該測試條件的每個可能答案, 位于決策樹最頂
端的節(jié)點為根節(jié)點。每個分支會連接另一個節(jié)點, 或者連接決策樹的末
端( 即樹葉節(jié)點) , 決策樹建立起來后, 需要預(yù)測的數(shù)據(jù)對象從根節(jié)點出
發(fā), 根據(jù)所經(jīng)過的節(jié)點的測試條件選擇要經(jīng)過的分支, 并最終到達(dá)樹葉
節(jié)點。樹葉節(jié)點的值或類別也就是要賦予該數(shù)據(jù)對象的值或類別。
決策樹可以通過圖形和文字的形式展現(xiàn)出來, 可解釋性大大高于其
他數(shù)據(jù)挖掘工具, 如神經(jīng)網(wǎng)絡(luò)。建模人員可以通過觀察決策樹的各個節(jié)
點來了解數(shù)據(jù)集合的整體模式, 還可以根據(jù)領(lǐng)域知識和正常邏輯來判斷
決策樹的分類是否妥當(dāng)。當(dāng)數(shù)據(jù)挖掘任務(wù)是分類記錄或預(yù)測離散結(jié)果
時, 決策樹更是首選對象。此外, 決策樹比許多其他技術(shù)相比需要的數(shù)據(jù)
準(zhǔn)備更少些。因此, 決策樹技術(shù)被廣泛地應(yīng)用到銀行客戶關(guān)系管理中。
二、決策樹技術(shù)在銀行CRM中的實證研究
我國人口分布特征是約80%的人口為農(nóng)村戶口, 本文采用的實證研
究數(shù)據(jù)來源于農(nóng)行浙江分行某縣級市支行所屬的分理處。該分理處主要
的客戶對象所在鎮(zhèn)的農(nóng)民儲戶、當(dāng)?shù)鼐用瘛€體經(jīng)商戶等, 存款額( 個人、
單位、同業(yè)存款) 4 億元以上, 貸款2.5 億元左右。
( 一) 數(shù)據(jù)挖掘任務(wù)的提出。在傳統(tǒng)存貸款業(yè)務(wù)中主要包括三類, 即
個人、單位和同業(yè)存款。其中個人儲蓄主要形式是活期和定期等形式, 在
個人存款客戶關(guān)系管理中, 由于客戶分散, 數(shù)量較多, 利用決策樹技術(shù)對
客戶進(jìn)行分類, 并找出各類客戶的特征, 使其有目標(biāo)、針對性地開展客戶
營銷活動, 降低客戶營銷成本, 提高銀行新的利潤增長點。
( 二) 用于數(shù)據(jù)挖掘的數(shù)據(jù)分析。在客戶關(guān)系管理的數(shù)據(jù)挖掘系統(tǒng)
中, 并不是所有的數(shù)據(jù)格式都能直接被用于數(shù)據(jù)挖掘, 一般用于數(shù)據(jù)挖
掘的數(shù)據(jù)有以下特點: 一是所有的數(shù)據(jù)應(yīng)該放在單一的表格中; 二是每
行應(yīng)該與一個實體相對應(yīng), 例如客戶; 三是帶有單一數(shù)值的列應(yīng)該被忽
略; 四是對每列帶有不同數(shù)值的列應(yīng)該被忽略; 五是對于預(yù)言性建模, 目
標(biāo)列應(yīng)該被識別, 并且所有的同義列要除去。因此, 必須對數(shù)據(jù)進(jìn)行預(yù)處
理。
( 三) 數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理是從大量的數(shù)據(jù)屬性中提取出對目標(biāo)
有重要影響的屬性來降低原始數(shù)據(jù)的維數(shù), 或者是處理一些不好的數(shù)
據(jù), 從而改善實例數(shù)據(jù)的質(zhì)量和提高數(shù)據(jù)挖掘的速度, 包括數(shù)據(jù)收集與
整理、清理、變換等。數(shù)據(jù)收集與整理主要是選擇正確的數(shù)據(jù)源; 數(shù)據(jù)清
理主要是對數(shù)據(jù)庫中的異常數(shù)據(jù)、不相關(guān)字段或互相沖突的字段進(jìn)行處
理。清理的方法包括直接刪除空缺項、人工填補(bǔ)空缺值、使用屬性的平均
值填寫空缺值。數(shù)據(jù)變換是將數(shù)據(jù)進(jìn)行規(guī)范化和聚集。規(guī)范化可以改進(jìn)
涉及距離度量的挖掘算法的精度和有效性。聚集是對數(shù)據(jù)進(jìn)行匯總。
本例數(shù)據(jù)預(yù)處理分析: 1.數(shù)據(jù)收集與整理。原始數(shù)據(jù)有活期儲戶一
覽表和定期儲戶一覽表, 表中有近兩萬個記錄, 其中活期儲戶一覽表中
包括姓名、身份證號碼、賬號、開戶日期、余額、積數(shù)等信息。“積數(shù)”是指:
以一年為計數(shù)單位, 以每年的7 月1 日為基準(zhǔn)日, 至統(tǒng)計截止日為止的
儲戶賬戶余額逐日累計的總額, 例: 某儲戶活期賬戶7 月1 日時余額為
1000元, 假設(shè)該儲戶賬戶中的余額一直未變, 又假設(shè)統(tǒng)計截止日為7 月
8 日, 則該儲戶的積數(shù)為1000×8=8000 元。因此, “積數(shù)”數(shù)額的大小實際
上直接反映了儲戶對銀行籌資貢獻(xiàn)的大小。考慮到儲戶開戶時間的長短
不同,用積數(shù)作為預(yù)測變量不能正確衡量差異性, 因為相同的儲蓄金額,
開戶時間長的, 其積數(shù)一定比開戶時間短的高。因此, 引入“平均積數(shù)”來
替代“積數(shù)”。平均積數(shù)的計算公式為: 平均積數(shù)=積數(shù)/天數(shù)。平均積數(shù)的
另一個名詞稱為每戶日均存儲余額,反映的是單戶日均數(shù)。定期儲戶一
覽表中包括姓名、身份證號碼、賬號、開戶日期、存款期限、存款金額等信
息。2.數(shù)據(jù)清理。對近萬個客戶記錄的活期儲蓄數(shù)據(jù)進(jìn)行清理, 主要是對
身份證號碼不全者( 有些是實名制前的客戶資料) , 由于存在無法推導(dǎo)其
真實年齡( 性別可根據(jù)客戶姓名大致判斷) 等問題, 因此將這部分?jǐn)?shù)據(jù)直
接進(jìn)行了刪除。此外, 還刪除了銀行提供的“積數(shù)”為零的值。3.數(shù)據(jù)變
換。經(jīng)清理后, 將數(shù)據(jù)進(jìn)行必要的變換, 本文確定了用于數(shù)據(jù)挖掘的相關(guān)
屬性共六個: 年齡、性別、存款余額、賬戶使用年限、平均積數(shù)和是否定期
儲戶。
( 四) 概念分層
從數(shù)據(jù)分析可知, 對每列帶有不同數(shù)值的列是不適合用于數(shù)據(jù)挖掘
的。因此, 數(shù)據(jù)還要進(jìn)行概念分層處理。概念分層最重要的問題是: 如何
確定一個最佳的分割閥值。
( 五) 決策樹生成過程
根據(jù)數(shù)據(jù)挖掘任務(wù), 將目標(biāo)變量定為“是否定期儲戶”, 屬性為
nominal, 取值為“0”或“1”, 其中“0”表示不是定期儲戶, “1”表示既是活期
儲戶同時也是定期儲戶。預(yù)測變量為: 性別、年齡、使用年限、余額和平均
積數(shù)。本文選用C&RT 算法即決策樹分類和回歸算法。該算法是一種完
全兩分類樹型分析法則, 用來方便細(xì)分?jǐn)?shù)據(jù)以及生成精確的同質(zhì)性子
集。
( 六) 由決策樹提取出該銀行客戶分類規(guī)則
圖1 的決策樹由于不存在過分?jǐn)M合等情況, 因此, 不需對其進(jìn)行剪
枝處理, 直接根據(jù)上述決策樹提取規(guī)則, 以IF- THEN 的形式來表示。對
從根到樹葉的每條路徑創(chuàng)建一個規(guī)則。在給定的路徑上的每個屬性- 值
對形成規(guī)則前件( “IF”部分) 的一個合取項。葉節(jié)點包含類預(yù)測, 形成規(guī)
則后件( “THEN”部分) 。
沿著根節(jié)點到葉節(jié)點的路徑, 圖1 的決策樹可以轉(zhuǎn)換成IF- THEN
分類規(guī)則, 如下所述:
1.IF 年齡>70 AND 平均積數(shù)<=312 THEN 86.8%的活期儲戶選擇
定期; 2.IF 年齡>70 AND 平均積數(shù)>312 THEN 61.8%的活期儲戶選擇
定期; 3.IF 年齡<70 AND 平均積數(shù)<=27348.28 AND 余額<=134.51
THEN 3.5%的活期儲戶選擇定期; 4.IF 年齡<70 AND 平均積數(shù)<=
27348.28 AND 余額>134.51 THEN 7.5%的活期儲戶選擇定期; 5.IF 年
齡<70 AND 27348.28<平均積數(shù)<=38483.12 THEN 21%的活期儲戶選
擇定期; 6.IF 年齡<70 AND 平均積數(shù)>38483 THEN 59.2%的活期儲戶
選擇定期。
三、結(jié)論與建議
1.銀行活期儲蓄客戶中, 是否同時是定期儲戶這一條件不受性別影
響, 與活期儲蓄賬戶使用年限的關(guān)系也不大。因此, 可不必過多地去考慮
儲戶的性別和賬戶使用年限,而跟年齡和平均積數(shù)有很大的關(guān)系。
2.年齡在70 歲以上的客戶, 同時選擇定期儲蓄存款的可能性極大。
不難分析出, 這部分儲戶的儲蓄的動機(jī)主要目的是為了防老。在我國, 尤
其是廣大農(nóng)村( 本案例的數(shù)據(jù)提供銀行為縣級市支行下屬分理處, 因此,
其客戶的身份多數(shù)是農(nóng)民和小城鎮(zhèn)居民) 社保體系極不完善, 人們就不
得不進(jìn)行生老病死等費用的預(yù)防性儲蓄。因此, 此類客戶一般是較忠誠
的客戶, 除非等著急用, 一般存入銀行的錢不會輕易取出, 可以把他們歸
為忠誠度較高的客戶。其次, 這類客戶的另一個特點是其儲蓄金額不會
太大, 從本案例的數(shù)據(jù)中可以看出, 此類儲戶平均定期儲蓄金額為
8576.23 元。究其原因, 此類客戶的收入來源比較單一, 自己已沒有勞動
能力創(chuàng)造財富, 其財富的積累靠平時的節(jié)儉、力所能及的勞動以及子女
的贍養(yǎng)積攢而成。因此, 根據(jù)此特點, 建議銀行對此類客戶不必投入過多
的營銷費用, 因為他們的儲蓄能力有限。
3.建議銀行關(guān)注平均積數(shù)的數(shù)額, 平均積數(shù)大于38483 元的活期儲
戶大部分也會同時選擇定期儲蓄。分析此類客戶的特點, 其一, 年齡在
70 歲以下, 富有勞動力, 平均積數(shù)高意味著財富相對較多, 且平均積數(shù)
的大小直接與銀行的貢獻(xiàn)率相關(guān)。平均積數(shù)越大, 其對銀行的貢獻(xiàn)就越
大; 其二, 本案例的數(shù)據(jù)中可以看出, 此類客戶的平均定期儲蓄金額高達(dá)
175632 元, 平均積數(shù)高同時也意味著資金流動量大。因此, 根據(jù)以上特
征可以判斷出此類客戶屬于高收入階層。其中, 有一些是企業(yè)經(jīng)營者、個
體老板。對于此類客戶, 銀行應(yīng)把他們列入重點營銷對象進(jìn)行營銷, 平時
應(yīng)加強(qiáng)與他們的聯(lián)系。采取比對一般客戶更加有吸引力、更加優(yōu)惠的政
策以牢牢保持住這部分高貢獻(xiàn)度、高收入的客戶。
4.對于平均積數(shù)在27348.28 元與38483 元之間的活期儲戶, 其中有
大概五分之一的人會同時選擇定期儲蓄, 根據(jù)分析, 此類客戶一般為縣
城中的中低等收入者。對此類客戶建議銀行進(jìn)行關(guān)注, 可作為銀行定活
儲蓄的潛在客戶進(jìn)行關(guān)注, 并應(yīng)采取一定的營銷策略, 推出各種優(yōu)惠條
件, 以吸納其儲蓄金額, 為銀行的業(yè)務(wù)發(fā)展作貢獻(xiàn)。
5.對于平均積數(shù)低于27348.28 元的活期儲戶, 這類客戶同時存定期
儲蓄的可能性較低, 因此, 可作為一般客戶處理。當(dāng)然, 在現(xiàn)實生活中我
們亦不難發(fā)現(xiàn), 雖然他們當(dāng)前對儲蓄的熱情并不高, 隨著收入條件的變
化以及理財方式的改變, 他們依舊是銀行的潛在客戶, 所以, 銀行最好也
能采取相應(yīng)的措施管理這部分客戶, 為銀行將來進(jìn)一步開拓市場做準(zhǔn)
備。[作者: 浙江經(jīng)濟(jì)職業(yè)技術(shù)學(xué)院]
強(qiáng)力推薦:
天柏客戶關(guān)系管理系統(tǒng)
天柏客戶關(guān)系管理系統(tǒng)(CRM)是一款集專業(yè)性、實用性、易用性為一體的純B/S架構(gòu)的CRM系統(tǒng),它基于以客