CRM系統:基于數據挖掘技術的CRM 系統中客戶行為
基于數據挖掘技術的CRM 系統中客戶行為
葛淑杰
(黑龍江科技學院 計算機與信息工程系,黑龍江 哈爾濱 150027)
摘 要:為了解決在企業中實施客戶關系管理(CRM), CRM 系統中客戶行為的定量研究問題, 利用決策樹的數據挖掘相關技術和方法,
提出了UPTree 數據挖掘算法,并采用UPTree 算法對隱藏在大量客戶行為中的信息進行挖掘,從而獲取了CRM 系統中潛在的客戶行為
規則,并給出這些行為規則的IF-THEN 的描述形式,為企業的科學決策提供依據。
關鍵詞:CRM; 數據挖掘;客戶行為
中圖分類號:TP 391 文獻標識碼:A
Behavior of customers in CRM system based on data mining technology
GE Shu-jie
(Department of Computer and Information Engineering, Heilongjiang Institute of Science and
Technology, Harbin 150027, China)
Abstract:To study the customer behavior by carrying out Customer Relationship Management (CRM) in
enterprises, we use some relative technology and method of decision tree of data mining to propose a kind of
UPTree algorithm of data Mining, which is used to mine a great deal of information hidden in customer behavior.
So we can gain series of potential customer behavior rules , introducing IF-THEN description form of those
behavior rules to provide beneficial basis for scientific decision of enterprises.
Key words: CRM;data mining;behavior of customers
0 引 言
隨著信息技術與網絡化經濟快速發展,商業
模式發生了根本性變化。很多行業所提供的產品和
服務日益商品化,企業產品同質化傾向越來越強,
市場競爭越來越激烈,同時客戶對產品和服務的質
量、個性化和價值的要求越來越高。在這種環境下,
建立和維持良好的客戶關系成為企業取得競爭優
勢的最重要基礎。這就需要企業完整掌握客戶信
息,準確把握客戶要求,快速響應個性化需求,提
供便捷購買渠道和良好服務,提高客戶滿意度和忠
誠度。在這樣的前提下,客戶關系管理(CRM)應
運而生。這也是企業管理理念從傳統以產品、銷售
中心的客戶關系向以客戶滿意為中心的客戶關系
轉變的必然結果,建立以客戶為中心的管理體系是
關系到企業生存與發展的戰略決策。
1 客戶關系管理整體架構
CRM 是通過收集、加工和處理涉及客戶行為
的大量信息,確定特定消費群體或個體的興趣、消
費習慣、消費傾向和消費需求,進而推斷出相應消
費群體或個體下一步的消費行為,然后以此為基
礎,對所識別出來的消費群體進行特定內容的定向
營銷,提高了營銷效果,為企業帶來更多的利潤。
客戶關系管理架構從整體上來說,包括三個層
面的應用,分別是客戶接入、業務流程管理以及決
策支持。其中客戶接入是利用電子商務、呼叫中心
等與客戶互動及快速響應;業務流程管理是實現市
場、銷售、服務等部門的全程量化管理及工作自動
化;決策支持是利用數據倉庫/數據挖掘技術提供支
持[1]。
2 數據挖掘
2.1 數據挖掘概念
數據挖掘就是從大量的、不完全的、隨機的數
據中,提取隱含在其中的、人們事先不知道的、但
又潛在有用的信息和知識的過程,數據挖掘過程一
般由3 個階段組成:數據準備、數據挖掘以及解釋
評估。數據挖掘是整個知識發現過程的一個步驟,
是由一些特定的數據挖掘算法組成,其功能和目的
是:在可以接受的計算效率的限制條件下,生成一
個事實(F)的模式表達(E)的計算或列舉。數據
挖掘主要通過分類、回歸、聚類以及關聯等方法來
實現,本文所用的數據挖掘技術為分類挖掘[2]。
分類的直觀含義是基于訓練集形成一個模型,
訓練集中的類標簽是已知的,使用該模型對新的數
據進行預測,確定給定數據屬于哪一類標簽。分類
的目的是發現一個模型去預測目標函數的值,該模
型的結果可能的形式包括代數表達式、決策樹、神
經網絡、一個復雜的算法、或者上述方法的聯合。
2.2 客戶關系管理系統中數據挖掘過程
隨著數據庫技術的迅速發展以及數據庫管理
系統的廣泛應用,人們積累的數據越來越多。但是
在CRM 系統中真正具有更深層次的數據處理的系
統還不多,如目前的數據庫系統只能完成數據的錄
入、查詢、統計等功能,但無法發現數據中存在的
關系和規則,無法根據現有的數據預測未來的發展
趨勢。所以,企業決策者希望CRM 系統在提供有
效管理大量客戶信息的同時,能夠對其進行更高層
次的分析,進一步發現隱藏于客戶信息表中的、潛
在有用的信息和知識,最大限度地反映企業客戶的
某種規律性,找出有價值的信息,從而指導商業行
為,這個過程即CRM 系統中的數據挖掘.
3 數據選擇與預處理
本文的數據取自惠通電腦銷售實業總公司近
幾年的銷售記錄。該公司數據倉庫中保存了數萬條
的數據信息。但是,用戶感興趣的常常只是數據倉
庫的一個子集。因此不加區分地挖掘整個數據倉庫
是不現實的。另外,現實世界的數據一般是含噪聲
的、不完全的和不一致的。采用數據預處理可以改
進數據質量,從而有助于提高挖掘過程的精度和性
能。在關系數據庫中,選擇相關的數據集并進行數
據預處理不僅使得挖掘更有效,而且能夠產生更有
意義的規則。
3.1 屬性相關性分析
在對數據倉庫進行數據挖掘時,其中大部分屬
性與挖掘任務不相關,是冗余的,遺漏相關屬性或
留下不相關屬性都是有害的,不相關或冗余的屬性
增加了數據量,可能會減慢挖掘進程,降低系統性
能。然而,對于用戶來說,確定哪些維/屬性應當包
含在類特征分析中則不是一件簡單的事情,所以應
當引進相應的方法進行屬性相關性分析,以過濾掉
統計上不相關或弱相關的屬性。
3.2 屬性相關性分析方法
為了保證輸入量與輸出量之間有一定的相關
度,可以用信息增益來考察屬性間的相關性。1948
年,香農(C. E. Shannon)提出了信息論,并對信
息量(Information)和熵(Entropy)進行了定義[3]。
熵實際上是系統信息量的加權平均,也就是系
統的平均信息量,信息增益指標的原理就取自信息
論。
設指向N 的訓練集為S,其中包含m 個不同的
類,他們區分了不同的類Ci (for i=1, … , m)。設si
是S 中屬于類Ci 的記錄的個數。那么分裂之前,系
統的總熵:
I (s1, s2, … , sm) = -Σ (i=1 to m) pi log2(pi)
容易看出,總熵是屬于各個類的記錄的信息量
強力推薦:
天柏客戶關系管理系統
天柏客戶關系管理系統(CRM)是一款集專業性、實用性、易用性為一體的純B/S架構的CRM系統,它基于以客戶為中心的協同管理思想和營銷理念,圍繞客戶生命周期的整個過程,針對不同價值的客戶實施以客戶滿意為目標的營銷策略,通過企業級協同,有效的“發現、保持和留住客戶”,從而達到留住客戶、提高銷售,實現企業利潤最大化的目的。通過對客戶進行7P的深入分析,即客戶概況分析(Profiling)、客戶忠誠度分析(Persistency)、客戶利潤分析(Profitability)、客戶性能分析(Performance)、客戶未來分析(Prospecting)、客戶產品分析(Product)、客戶促銷分析(Promotion)以及改善與管理企業銷售、營銷、客戶服務和支持等與客戶關系有關的業務流程并提高各個環節的自動化程度,從而幫助企業達到縮短銷售周期、降低銷售成本、擴大銷售量、增加收入與盈利、搶占更多市場份額、尋求新的市場機會和銷售渠道,最終從根本上提升企業的核心競爭力,使得企業在當前激烈的競爭環境中立于不敗之地。
關鍵詞:CRM,CRM系統,CRM軟件,客戶關系管理,客戶管理軟件,客戶管理系統,客戶關系管理軟件,客戶關系管理系統