CRM系統:數據挖掘在電信客戶關系管理的應用
數據挖掘在電信客戶關系管理的應用
何明軒
( 同濟大學, 上海200092)
摘要: 本文介紹了數據挖掘的相關概念與知識, 提出了數據挖掘在當今從海量數據中提取相關信息, 和知識發現的過程, 與此同時介
紹了數據挖掘在幫助企業進行數據分析, 推理, 預測的應用, 例如: 關聯分析、時序模式、偏差分析、分類、聚類、預測等。與此同時, 著重提
出了數據挖掘在電信行業營銷的應用, 介紹了國內外應用現狀, 并以國內某電信運營商的數據倉庫項目為例, 例證了數據挖掘在客戶分
群和流失預測的成功應用, 在此基礎上, 展望了未來的可發展方向。
關鍵詞: 數據挖掘; 企業應用; 電信客戶分群; 客戶流失預測
中圖分類號: TP274 文獻標識碼: A 文章編號: 1009- 3044(2007)03- 10620- 02
The Application of Data Mining on CRM in Telecommunicaion
HE Ming- xuan
(Tongji University,Shanghai 200092)
Abs tract:This paper is about the introduction of data mining including the conception and some related knowledge which is discovering invisible
information from huge of data, we can call it process of knowledge of learning. Meanwhile, it also presents the application of data mining
on the field of data analysis, consequence and forecast in enterprises. For example, association analysis, warp analysis, sequence module, classification
and clustering. It also takes a telecommunication enterprises as example, which testified the success of attempt at using data mining at customer
clustering and prediction of losing customers. At the end of the paper, it prospects the future of the App of data mining on the solution of
other problems in telecommunication.
Key words :Data mining; Application on enterprises; Customer clustering; Prediction of losing customer
1 引言
隨著國內電信市場競爭的日趨激烈, 電信運營商的經營模式
逐漸從“技術驅動”向“市場驅動”、“客戶驅動”轉化。這就要求運
營商要采取以客戶為中心的策略, 根據客戶的實際需求提供多樣
化、層次化、個性化的服務解決方案。因此, 客戶關系管理成了電
信運營商增加收入和利潤, 提高客戶滿意度、忠誠度的有效工具。
在客戶關系管理的流程中, 為了準確、及時地進行經營決策, 必須
充分獲取并利用相關的數據信息對決策過程進行輔助支持。另
外, 面對用戶的多樣化、層次化、個性化的需求, 大眾化營銷已經
失去了它的優勢, 基于客戶信息、客戶價值和行為的深入的數據
分析的洞察力營銷、精確化營銷的理念逐漸被各大電信運營商所
接受, 并渴望通過從數據中挖掘價值來減少營銷成本、提高
營銷效益。近幾年迅速發展起來的數據挖掘技術成為實現這些目
標的必要手段。
數據挖掘是從海量數據中提取隱含在其中的有用信息和知
識的過程。它可以幫助企業對數據進行微觀、中觀乃至宏觀的統
計、分析、綜合和推理, 從而利用已有數據預測未來, 幫助企業贏
得競爭優勢。例如, 利用數據挖掘可以對企業的海量數據進行客
戶分析, 包括客戶類型、各類客戶的需求傾向、購買行為預測和客
戶信用政策分析、客戶流失分析等; 進行市場研究, 包括商品市場
占有率預測、市場拓展計劃仿真; 進行經營策略研究, 包括經營成
本與收入分析、風險控制、欺詐行為甄別等。
數據挖掘旨在從數據庫中提取正確的、非平常的、未知的、有
潛在應用價值的并最終可為用戶理解的模式。它的出現為自動和
智能地把海量的數據轉化成有用的信息和知識提供了手段。數據
挖掘涉及到諸如機器學習、模式識別、統計學、數據庫和人工智能
等等眾多學科, 是數據庫理論和機器學習的交叉學科。
2 數據挖掘主要的一些應用
(1)關聯分析: 其目的就是挖掘出隱藏在數據間的相互關系。
例如, 買電腦的顧客同時會買某種軟件, 這就是一條關聯規則。
(2) 時序模式: 通過時間序列搜索出重復發生概率較高的模
式, 這里強調時間序列的影響。例如, 購買了激光打印機的人中,
半年后80%的人會買新硒鼓。
(3)分類: 找出一個類別的概念描述, 它代表了這類數據的整
體信息。分類數據挖掘中應用最多的任務。
(4)聚類: 按一定規則將數據分為一系列有意義的子集。同一
聚類中, 個體之間的差距較小; 不同聚類中, 個體之間的距離偏
大。聚類和分類有著很大的區別: 分類時, 我們總是事先知道哪些
屬性是重要的, 我們總是將重要的、有影響力的屬性作為分類的
依據; 而聚類時, 我們事先根本不知道哪些屬性起作用, 我們的任
務就是要找到那些起關鍵作用的屬性。
(5)偏差分析: 從數據庫中找出異常數據, 比如欺詐行為的發
現。
(6)預測: 利用歷史數據找出規律, 建立模型, 并用此模型預測
未來數據的種類、特征等。
在國內外, 數據挖掘已經有不少成功案例。目前國內企業實
現數據挖掘的困難在于缺少數據積累、難于構建業務模型、各類
人員之間的溝通存在障礙、缺少有經驗的實施者、初期資金投入
較大。而在國外, 數據挖掘首先在金融、證券、電信、零售業等數據
密集型行業實施, 因為這些行業信息化程度比較高, 數據庫中已
經保留了大量數據資源。有數據表明, 進入二十世紀90 年代, 人
類積累的數據量以每月高于15%的速度增加, 如果不借助強有力
的挖掘工具, 僅依靠人的能力來理解這些數據是不可能的。數據
挖掘的前景被人們普遍看好。國際知名調查機構Gartner Group 在
高級技術調查報告中, 將數據挖掘和人工智能列為“未來三到五
年內將對工業產生深遠影響的五大關鍵技術”之首, 還將并行處
理體系和數據挖掘列為未來五年內投資焦點的十大新興技術前
兩位。Gartner 的調查報告預計: 到2010 年, 數據挖掘在相關市場
的應用將從目前少于5%增加到超過80%。美國銀行家協會預測
數據倉庫和數據挖掘技術在美國商業銀行的應用增長率是
14.9%。
數據挖掘目前在電信行業也已得到廣泛應用, 比如:
(1)客戶消費模式分析
客戶消費模式分析( 如固話話費行為分析) 是對客戶歷年來
長話、市話、信息臺的大量詳單、數據以及客戶檔案資料等相關數
據進行關聯分析, 結合客戶的分類, 可以從消費能力、消費習慣、
消費周期等諸方面對客戶的話費行為進行分析和預測, 從而為固
話運營商的相關經營決策提供依據。
(2)客戶市場推廣分析
客戶市場推廣分析( 如優惠策略預測仿真) 是利用數據挖掘
技術實現優惠策略的仿真, 根據數據挖掘模型進行模擬計費和模
擬出賬, 其仿真結果可以揭示優惠策略中存在的問題, 并進行相
應的調整優化, 以達到優惠促銷活動的收益最大化。
(3)客戶欠費分析和動態防欺詐
通過數據挖掘, 總結各種騙費、欠費行為的內在規律, 并建立
一套欺詐和欠費行為的規則庫。當客戶的話費行為與該庫中規則
吻合時, 系統可以提示運營商相關部門采取措施, 從而降低運營
商的損失風險。
(4)客戶流失分析
根據已有的客戶流失數據, 建立客戶屬性、服務屬性、客戶消
費情況等數據與客戶流失概率相關聯的數學模型, 找出這些數據
之間的關系, 并給出明確的數學公式。然后根據此模型來監控客
戶流失的可能性, 如果客戶流失的可能性過高, 則通過促銷等手
段來提高客戶忠誠度, 防止客戶流失的發生。這就徹底改變了以
往電信運營商在成功獲得客戶以后無法監控客戶流失、無法有效
實現客戶關懷的狀況。
各運營支撐系統所積累的海量歷史數據是企業的一筆寶貴
財富, 誰能正確地挖掘與分析隱含在數據中的知識, 誰就能更好
地向用戶提供產品與服務, 從而在競爭中獲勝。數據挖掘正是充
分利用這些寶貴資源從中提取知識的一種技術。在國外, 英國電
信選用了SPSS 的數據挖掘產品Clementine, 為其“商業高速公路”
活動分析數據和建立探索模型, 更好地了解了這些客戶的行為特
征, 向銷售人員提供最佳客戶的清單, 直郵活動回應率提高了
100%。美國西部電信利用銷售活動管理軟件, 連同SAS 的Enterprise
Miner 一起, 既消除了銷售人員對全部客戶數據進行評分
的負擔, 也減少了手工干預所造成的人為錯誤, 公司的市場營銷
周期大為縮短, 使企業得到了更高的營銷投資回報。麻薩諸賽州
Lightbridge 公司用數據挖掘技術中的分類回歸樹為英格蘭一家主
要電話公司建立和部署了一個分析客戶流失的預測模型, 使得公
司能及時發現高價值的流失客戶并且能夠及時采取挽留的措施,
極大降低了電話公司客戶流失率。比利時國家電信使用數據倉庫
建立顧客信息系統, 通過實施客戶欺騙檢測, 能夠很快發現反常
電話以及欺騙性的打電話方式, 并能在造成重大經濟損失之前終
止這種欺騙行為。
某電信運營商實施數據挖掘應用有非常好的基礎, 某電信運
營商在ITSP 規劃指導下, 于2004 年3 月啟動數據倉庫項目, 并
于2005 年6 月完成項目初驗。建立了企業統一數據視圖和統一
統計口徑的數據倉庫為數據挖掘提供了進行廣泛的數據分析的
基礎。數據挖掘和數據倉庫的協同工作, 一方面, 可以迎合和簡化
數據挖掘過程中的重要步驟, 提高數據挖掘的效率和能力, 確保
數據挖掘中數據來源的廣泛性和完整性。另一方面, 數據挖掘技
術已經成為數據倉庫應用中極為重要和相對獨立的方面和工具。
數據挖掘和數據倉庫的融合與互動發展為廣大渴望從數據“奴
隸”到數據“主人”轉變的企業最終用戶提供了通途。另外, 該電信
也已經在數據挖掘應用方面作出了許多卓有成效的嘗試。數據倉
庫的建設期間, 數據挖掘應用也在其地市電信分公司進行了試點
工作, 在客戶流失預測和客戶分群分面取得了顯著的應用效果。
該公司于2005 年1 月20 日在某市啟動基于數據挖掘的客戶分
群應用的MR 項目試點, 4 月1 日完成試點客戶分群, 隨后用一個
月時間在另一試點進行了推廣, 目前已于8 月30 日通過了MR
試點初驗。通過客戶分群, 根據客戶可能的行為和潛在的價值對
客戶進行分類, 針對每一類客戶的特點制定有針對性的營銷策
略, 為市