CRM系統(tǒng):CRM 中用Apriori 算法評(píng)估客戶興趣度
CRM 中用Apriori 算法評(píng)估客戶興趣度
王荇李慧
( 常州工學(xué)院計(jì)算機(jī)信息工程學(xué)院" 江蘇常州213002)
[摘要] Apriori 算法作為一種典型的關(guān)聯(lián)規(guī)則算法" 將其應(yīng)用在CRM 中" 對(duì)于促進(jìn)CRM 進(jìn)一步向智能化發(fā)展" 提升CRM
價(jià)值起到非常重要的作用! 文章首先介紹Apriori 算法的基本原則* 方法" 然后介紹興趣關(guān)聯(lián)規(guī)則的概念與實(shí)現(xiàn)方法" 最后對(duì)
用Apriori 算法評(píng)估客戶興趣度進(jìn)行了探討!
[關(guān)鍵詞] Apriori 算法+ 關(guān)聯(lián)規(guī)則+ 頻繁項(xiàng)集+ 支持度
1 引言
CRM(客戶關(guān)系管理)是一種以客戶為中心的經(jīng)營策略! 它以
信息技術(shù)為手段" 將客戶數(shù)據(jù)作為基礎(chǔ)" 通過數(shù)據(jù)分析技術(shù)加強(qiáng)
對(duì)客戶的了解" 并對(duì)CRM 流程進(jìn)行重新設(shè)計(jì)! 面對(duì)海量的數(shù)據(jù)
信息" 怎樣采用方便有效的手段從中找出有價(jià)值的信息" 數(shù)據(jù)挖
掘作為最有效的手段成為目前熱門的話題!
2 Apriori 算法概述
Apriori 算法是一種典型的關(guān)聯(lián)規(guī)則算法! Apriori 使用一種稱
作逐層搜索的迭代方法" k- 項(xiàng)集用于(k+1)- 項(xiàng)集! 首先" 找出
頻繁1- 項(xiàng)集的集合" 該集合記作L1! L1 用作頻繁2- 項(xiàng)集的集
合L2" 而L2 用于找L3" 如此下去" 直到不能找到頻繁k- 項(xiàng)集!
找到每個(gè)Lk 需要一次數(shù)據(jù)庫掃描!
下面介紹發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的Apriori 算法! 我們引入若干記號(hào)"
具有k 個(gè)項(xiàng)的項(xiàng)集稱為k- 項(xiàng)集" 同時(shí)我們稱該項(xiàng)集的長度為k!
Lk 記由k- 項(xiàng)集構(gòu)成的集合! 頻繁項(xiàng)集的發(fā)現(xiàn)方法是一種漸近的
方法! 具體如下#
!遍歷數(shù)據(jù)庫一次" 記錄每個(gè)數(shù)據(jù)項(xiàng)出現(xiàn)次數(shù)" 即計(jì)算每個(gè)
項(xiàng)的支持度" 收集所有支持度不低于用戶最低支持度閾值的項(xiàng)"
構(gòu)成頻繁1- 項(xiàng)集的集合L1!
"兩兩連接L1 中的項(xiàng)集" 形成候選2- 項(xiàng)集的集合C2!
#再次遍歷數(shù)據(jù)庫" 計(jì)算C2 中每個(gè)候選2- 項(xiàng)集的支持度"
收集所有支持度不低于用戶最低支持度閾值的2- 項(xiàng)集構(gòu)成頻繁
2- 項(xiàng)集的集合L2!
$通過兩兩連接L2 中的項(xiàng)集" 形成候選3- 項(xiàng)集的集合C3!
%再次遍歷數(shù)據(jù)庫" 計(jì)算C3 中每個(gè)候選3- 項(xiàng)集的支持度"
收集所有支持度不低于用戶最低支持度閾值的3- 項(xiàng)集構(gòu)成頻繁
3- 項(xiàng)集的集合L3! 反復(fù)執(zhí)行上述過程" 直到新的候選項(xiàng)集Ck 為
空時(shí)停止!
顯然" 該方法需要對(duì)數(shù)據(jù)庫作多次遍歷! 如果頻繁項(xiàng)集的長
度最長為P" 就要偏歷P 次!
算法高效的關(guān)鍵在于生成較小的候選項(xiàng)集" 也就是盡可能不
生成和計(jì)算那些不可能成為頻繁項(xiàng)集的候選項(xiàng)集! 為了實(shí)現(xiàn)這一
點(diǎn)" Apriori 算法使用了這樣一個(gè)基本性質(zhì)" 即一個(gè)頻繁項(xiàng)集的任
意子集必定也是一個(gè)頻繁項(xiàng)集!
如何將Apriori 性質(zhì)用子算法$ 為理解這一點(diǎn)" 必須看看如何
用Lk- 1 找Lk,其步驟由連接和剪枝組成!
2.1 連接步
為找Lk" 通過Lk- 1 與自己連接產(chǎn)生候選k- 項(xiàng)集的集合!
該候選項(xiàng)集的集合稱作Ck! 設(shè)l1 和l2 是Lk- 1 中的項(xiàng)集" 記號(hào)li
[j]表示li 的第j 項(xiàng)(例如" l1[k- 2]表示l1 的倒數(shù)第3 項(xiàng))! 為方便計(jì)
算" 假定事務(wù)或項(xiàng)集中的項(xiàng)按字典次序排序! 執(zhí)行連接
Lk- 1&Lk- 1,其中Lk- 1 的元素是可連接的" 如果他們前(k- 2)個(gè)
項(xiàng)相同! 即Lk- 1 的元素l1 和l2 是可連接的" 如果(l1 [1]= l2 [1])
!(l1 [2]= l2 [2])!%!(l1 [k- 2]= l2 [k- 2])!(l1 [k- 1]= l2 [k- 1])"
條件(l1 [k- 2]< l2 [k- 2])是簡單的保證不產(chǎn)生重復(fù)! 連接l1 和l2 產(chǎn)
生的結(jié)果項(xiàng)集是l1 [1] l1 [2] %l1 [k- 2]l1 [k- 1] l2 [k- 1]!
2.2 剪枝步
Ck 是Lk 的超集" 即是" 它的成員可以是也可以不是頻繁的"
但所有的頻繁k- 項(xiàng)集都包含在Ck 中! 掃描數(shù)據(jù)庫" 確定Ck 中
每個(gè)候選的計(jì)數(shù)" 從而確定Lk (即根據(jù)定義" 計(jì)數(shù)值不小于最小
支持度計(jì)數(shù)的所有候選是頻繁的" 從而屬于Lk)! 然而Ck 可能很
大" 這樣所涉及的計(jì)算量就很大! 為壓縮Ck" 可以用以下辦法使
用Apriori 性質(zhì)" 任何非頻繁的(k- 1)- 項(xiàng)集都不可能是頻繁k- 項(xiàng)
集的子集! 因此" 如果一個(gè)候選k- 項(xiàng)集的(k- 1)- 子集不在Lk- 1
中" 則該候選也不可能是頻繁的" 從而可以由Ck 中刪除!
3 興趣關(guān)聯(lián)規(guī)則概述
關(guān)聯(lián)規(guī)則挖掘技術(shù)主要用于從用戶訪問序列數(shù)據(jù)庫的訪問序
列項(xiàng)中挖掘出相應(yīng)規(guī)則! 在WEB 數(shù)據(jù)挖掘中" 關(guān)聯(lián)規(guī)則挖掘就
是挖掘出用戶在一個(gè)訪問期間從服務(wù)器上訪問的文件/ 頁面的聯(lián)
系" 這些頁面之間可能并不存在直接參引關(guān)系(Reference)!
站點(diǎn)的設(shè)計(jì)一般遵循一種分類結(jié)構(gòu)" 即一個(gè)頁面的子頁面的
組織是根據(jù)子頁面的類別來安排的! 從另一方面來說" 這種結(jié)構(gòu)
也反映了用戶的興趣! 設(shè)一個(gè)頁面中有K個(gè)鏈接" 一個(gè)用戶對(duì)該
頁面的這些鏈接進(jìn)行訪問" 如果他首先訪問第i 個(gè)" 那么代表了
他對(duì)于該鏈接所達(dá)頁面的興趣大于其他鏈接所達(dá)頁面" 即
Interes t(i)> Interes t(i& ), i& !=i 式1
興趣關(guān)聯(lián)規(guī)則就是利用客戶興趣的相關(guān)性原則" 根據(jù)用戶已
經(jīng)或正在瀏覽的網(wǎng)頁推測客戶下一步將瀏覽的網(wǎng)頁" 并提前預(yù)取
出來" 這將大大加快打開網(wǎng)頁的速度" 提高網(wǎng)站的運(yùn)行效率!
通過興趣關(guān)聯(lián)規(guī)則" 我們可以發(fā)現(xiàn)客戶瀏覽網(wǎng)頁的相關(guān)性"
從而預(yù)測用戶將瀏覽的下一個(gè)頁面" 可以通過提前預(yù)取該網(wǎng)頁"
大大節(jié)約訪問時(shí)間!
4 Apriori 算法評(píng)估客戶興趣度
當(dāng)客戶訪問站點(diǎn)時(shí)" 通常帶有某種喜好" 客戶的訪問路徑中
蘊(yùn)藏了客戶對(duì)該站點(diǎn)的興趣及客戶的興趣轉(zhuǎn)移! Apriori 算法是數(shù)
據(jù)挖掘關(guān)聯(lián)規(guī)則技術(shù)中一種發(fā)現(xiàn)模式的典型方法! 在一個(gè)事務(wù)數(shù)
據(jù)庫中" 每一個(gè)事務(wù)都是一個(gè)’ 項(xiàng)’ 的集合! 一個(gè)規(guī)則由一個(gè)前
驅(qū)(左手邊)和一個(gè)后繼(右手邊)組成! 如果一個(gè)客戶購買了前驅(qū)中
的一個(gè)項(xiàng)" 那么它也可能購買后繼中的項(xiàng)! 首先構(gòu)造一個(gè)頻繁項(xiàng)
的候選集合" 其長度為k" 只要其中一項(xiàng)頻繁發(fā)生" 那么就從較
小長度的頻繁項(xiàng)集中構(gòu)造一個(gè)長度為k+1 的候選集合! 如此反復(fù)
迭代" 直到無法構(gòu)造候選項(xiàng)集! 該規(guī)則反應(yīng)了關(guān)聯(lián).
強(qiáng)力推薦:
天柏客戶關(guān)系管理系統(tǒng)
天柏客戶關(guān)系管理系統(tǒng)(CRM)是一款集專業(yè)性、實(shí)用性、易用性為一體的純B/S架構(gòu)的CRM系統(tǒng),它基于以客戶為中心的協(xié)同管理思想和營銷理念,圍繞客戶生命周期的整個(gè)過程,針對(duì)不同價(jià)值的客戶實(shí)施以客戶滿意為目標(biāo)的營銷策略,通過企業(yè)級(jí)協(xié)同,有效的“發(fā)現(xiàn)、保持和留住客戶”,從而達(dá)到留住客戶、提高銷售,實(shí)現(xiàn)企業(yè)利潤最大化的目的。通過對(duì)客戶進(jìn)行7P的深入分析,即客戶概況分析(Profiling)、客戶忠誠度分析(Persistency)、客戶利潤分析(Profitability)、客戶性能分析(Performance)、客戶未來分析(Prospecting)、客戶產(chǎn)品分析(Product)、客戶促銷分析(Promotion)以及改善與管理企業(yè)銷售、營銷、客戶服務(wù)和支持等與客戶關(guān)系有關(guān)的業(yè)務(wù)流程并提高各個(gè)環(huán)節(jié)的自動(dòng)化程度,從而幫助企業(yè)達(dá)到縮短銷售周期、降低銷售成本、擴(kuò)大銷售量、增加收入與盈利、搶占更多市場份額、尋求新的市場機(jī)會(huì)和銷售渠道,最終從根本上提升企業(yè)的核心競爭力,使得企業(yè)在當(dāng)前激烈的競爭環(huán)境中立于不敗之地。
關(guān)鍵詞:CRM,CRM系統(tǒng),CRM軟件,客戶關(guān)系管理,客戶管理軟件,客戶管理系統(tǒng),客戶關(guān)系管理軟件,客戶關(guān)系管理系統(tǒng)