CRM系統(tǒng):基于C IDOC CRM的虛擬博物館語(yǔ)義網(wǎng)絡(luò)架構(gòu)
基于C IDOC CRM的虛擬博物館語(yǔ)義網(wǎng)絡(luò)架構(gòu)
3
劉宏哲, 鮑 泓, 余杰華
(北京聯(lián)合大學(xué)信息技術(shù)研究所, 北京100101)
摘 要: 在語(yǔ)義網(wǎng)絡(luò)架構(gòu)下,以基于本體的概念參考模型CIDOC CRM作為數(shù)據(jù)描述的基礎(chǔ),用Web Services技
術(shù)建立基于語(yǔ)義的網(wǎng)上虛擬文物博物館分布式系統(tǒng)的相關(guān)機(jī)制。
關(guān)鍵詞: 語(yǔ)義網(wǎng)絡(luò); CIDOC CRM; Web Services; 本體; 虛擬博物館
中圖法分類號(hào): TP393 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 100123695 (2006) 0420050204
A SemanticWeb Architecture of VirtualMuseum Based on CIDOC CRM
L IU Hong2zhe, BAO Hong, YU J ie2hua
( Institute of Inform ation Technology, B eijing Union University, B eijing 100101, China)
Abstract: The most important purpose of digital museum is antique information sharing and p rocessing, but the distributed
and heterogeneity nature of the local digitalmuseum p revent the goal from achieving. How to solve the p roblem using semantic
Web architecture with Ontology2based concep tual reference model C IDOC CRM andWeb Services technology is exp lored.
Key words: SemanticWeb; C IDOC CRM; Web Services; Ontology; VirtualMuseum
文物具有很高價(jià)值也有很強(qiáng)的區(qū)域性,這一特點(diǎn)決定了文
物藏品保管者(博物館和個(gè)人)在不同地理空間相對(duì)獨(dú)立地保
存文物。盡管某些博物館已經(jīng)開(kāi)始實(shí)施文物數(shù)字化工程,但基
本上都是基于本地?cái)?shù)據(jù)庫(kù)的,各個(gè)博物館的數(shù)字化工程在數(shù)據(jù)
格式、計(jì)算機(jī)平臺(tái)以及具體技術(shù)上都存在很大差異,難以實(shí)現(xiàn)
互通互連,從而削弱了數(shù)字化文物資源共享的優(yōu)勢(shì)。對(duì)數(shù)字博
物館資源的搜索主要有基于內(nèi)容的和元數(shù)據(jù)的兩種。基于圖
像內(nèi)容檢索技術(shù)(CB IR)具有其不可替代性但同時(shí)也不能解決
全部問(wèn)題。現(xiàn)有的基于元數(shù)據(jù)的搜尋引擎主要是利用關(guān)鍵詞
查詢的方式,由于同一個(gè)關(guān)鍵詞在不同的語(yǔ)義環(huán)境中意義有可
能不同,同時(shí)一個(gè)語(yǔ)義可以由意義相近的不同詞語(yǔ)來(lái)表示,這
就造成關(guān)鍵詞查找的不準(zhǔn)確性。隨著現(xiàn)有資源的日益龐大,這
些問(wèn)題在現(xiàn)有的網(wǎng)絡(luò)架構(gòu)下愈來(lái)愈難獲得良好的解決。選擇
一種體系結(jié)構(gòu)和實(shí)現(xiàn)技術(shù)將現(xiàn)有的異構(gòu)系統(tǒng)集成并使得以上
問(wèn)題得到解決是一項(xiàng)重要的任務(wù)。本文闡述了如何用基于本
體的CIDOC CRM模型對(duì)文物領(lǐng)域的概念進(jìn)行分類和建立關(guān)
聯(lián)構(gòu)建語(yǔ)義網(wǎng)絡(luò)。
1 語(yǔ)義網(wǎng)絡(luò)架構(gòu)
網(wǎng)絡(luò)儲(chǔ)藏著越來(lái)越多來(lái)自不同數(shù)據(jù)源的、具有不同表示格
式的信息,表示、維護(hù)、查詢、處理這些信息變得越來(lái)越困難。
人們希望Web提供的信息不僅僅是機(jī)器可識(shí)別的,而且是機(jī)
器可以理解的。基于這種需求,語(yǔ)義網(wǎng)絡(luò)( SemanticWeb)架構(gòu)
應(yīng)運(yùn)而生。Internet之父Tim Berners2Lee給出如下定義: Se2
manticWeb是一個(gè)網(wǎng)絡(luò),它包含了文檔或文檔的一些部分,描
述了事物間的明顯關(guān)系,包含了語(yǔ)義信息,以利于機(jī)器的自動(dòng)
處理[ 1 ] 。
圖1為語(yǔ)義Web層次框架圖。在這個(gè)層次框架中, XML層
表示數(shù)據(jù), RDF表示數(shù)據(jù)的含義,本體(Ontology)表達(dá)數(shù)據(jù)含義
正式的、共同的理解, Logic提供了對(duì)有含義數(shù)據(jù)的智能推理。
Proof是指一旦我們所構(gòu)建出來(lái)的系統(tǒng)能夠根據(jù)本體論來(lái)驗(yàn)證
邏輯以及推論出結(jié)果,便可以用此機(jī)制來(lái)驗(yàn)證事情的對(duì)與否。
2 本體及文物領(lǐng)域本體概念參考模型
智能網(wǎng)絡(luò)的組成之一是本體(Ontology) ,它是實(shí)現(xiàn)語(yǔ)義
Web的重要技術(shù)。在哲學(xué)上,Ontology是有關(guān)存在的本質(zhì)以及
何種事物存在的理論,這是它作為一門學(xué)科所研究的理論。在
真實(shí)的世界中,每一個(gè)領(lǐng)域都會(huì)被描述成一個(gè)知識(shí)本體。同一
個(gè)術(shù)語(yǔ)在不同的領(lǐng)域、時(shí)代背景下甚至是使用不同的用法,其
意義就可能大不相同。用本體理論可以事先定義好這些術(shù)語(yǔ)
代表什么意義、屬于什么領(lǐng)域以及與其他術(shù)語(yǔ)之間的關(guān)系,完
成機(jī)器與人之間語(yǔ)義的交互。目前知識(shí)本體已被廣泛地應(yīng)用
于信息領(lǐng)域的信息檢索。
為了使基于本體制定出來(lái)的資料在概念上具有共同點(diǎn),提
高信息的可重用性和信息之間的可交換性,應(yīng)該采用統(tǒng)一的模
型[ 2 ]。在文化遺產(chǎn)(或稱文物博物館)領(lǐng)域,國(guó)際上的一些團(tuán)
體或相關(guān)組織制定了相應(yīng)的本體模型,且較成熟的模型有多
個(gè), 其中包括CIDOC CRM[ 3 ] , ABC Ongology[ 4 ] , CDWA[ 5 ] ,
AAT[ 5 ] , TGN[ 5 ] ,ULAN[ 5 ] , INCOCLASS[ 6 ]等模型。本系統(tǒng)選用
CIDOC CRM來(lái)構(gòu)建文物領(lǐng)域本體模型[ 7 ] ,其中CIDOC是組成
ICOM ( International Council forMuseums)組織的二十幾個(gè)委員
會(huì)( Committee ) 之一, 其全名是ComitéInternational pour la
DOCumentation,簡(jiǎn)稱為CIDOC。CIDOC 的成員中原本都是文
化遺產(chǎn)領(lǐng)域的專家以及技術(shù)人員制定的文化遺產(chǎn)信息(Cultu2
ral Heritage Information)領(lǐng)域的概念參考模型(Concep tual Refe2
renceModel, CRM) 。
CIDOC CRM目前已經(jīng)演變到v31419版本[ 3 ] ,該版本將文
化遺產(chǎn)領(lǐng)域定義出84個(gè)實(shí)體、141個(gè)關(guān)系,涵蓋了圍繞特定文
物發(fā)生的歷史史實(shí)、人文藝術(shù)、考古遺跡、時(shí)間地點(diǎn)人物以及版
權(quán)聲明等信息。隨著模型的不斷擴(kuò)展,實(shí)體和關(guān)系數(shù)量可能還
會(huì)增加。
CIDOC CRM是這些標(biāo)準(zhǔn)中嚴(yán)格遵循本體原則的一個(gè)模
型,由于有較長(zhǎng)的歷史,所以發(fā)展得比較完善。此模型目前被
多個(gè)本領(lǐng)域很有影響的項(xiàng)目所采用[ 8, 9 ] ,并且這個(gè)隊(duì)伍還在不
斷地加大。下面我們舉例說(shuō)明如何用CIDOC CRM模型描述
一個(gè)文物的信息.
模型中的所有實(shí)體和關(guān)系名稱都來(lái)自于CIDOC CRM規(guī)
范。在數(shù)據(jù)庫(kù)表中兩個(gè)字段數(shù)據(jù)之間是沒(méi)有關(guān)聯(lián)的,而CI2
DOC CRM不但可以表示數(shù)據(jù),還可以表示數(shù)據(jù)之間的關(guān)系。
例如, E22ManMade Object (文物“鼎”)與E57 Material (材質(zhì))
之間由關(guān)系P54 Consists of (組成成分)連接,這樣表示的概念
具有上下文,從而賦予了它一定的含義。
CIDOC CRM是構(gòu)建文化遺產(chǎn)領(lǐng)域的信息系統(tǒng)所用的共同
標(biāo)準(zhǔn)。因?yàn)槊總€(gè)系統(tǒng)需求的差異,所以我們?cè)谠O(shè)計(jì)時(shí)便可以只
針對(duì)需求決定使用哪些實(shí)體和關(guān)系,如徐悲鴻博物館可能側(cè)重
于對(duì)于圖畫(huà)作品的作者、主題、風(fēng)格流派、創(chuàng)作背景等,而考古
博物館則側(cè)重于墓葬遺址的產(chǎn)生、演變以及發(fā)現(xiàn)過(guò)程等。不同
的博物館之間所選用的實(shí)體和關(guān)系可能不同,但是都是基于一
個(gè)統(tǒng)一的模型,它們之間重疊部分就可以達(dá)到共享和交換。特
定博物館的CIDOC CRM模型應(yīng)該由領(lǐng)域?qū)<液图夹g(shù)人員合
作根據(jù)系統(tǒng)需求或者已有數(shù)據(jù)情況設(shè)計(jì), 正如參考文獻(xiàn)
[ 10, 11 ]中闡述的觀點(diǎn), CIDOC CRM模型設(shè)計(jì)的總體原則是模
型應(yīng)該能夠容納各種數(shù)據(jù),使得數(shù)據(jù)庫(kù)表的信息到模型的映射
不會(huì)有信息丟失。圖4表示CIDOC CRM模型對(duì)博物館1~N
的數(shù)據(jù)的映射集成。
各個(gè)地方數(shù)字博物館的模型設(shè)計(jì)完成后,需要將CIDOC
CRM概念模型轉(zhuǎn)換為網(wǎng)絡(luò)本體語(yǔ)言O(shè)WL (OntologyWeb Lan2
guage) [ 12, 13 ]表示的邏輯模型,此過(guò)程用斯坦福大學(xué)開(kāi)發(fā)的本體
編輯工具ProtégéOWL[ 14 ]實(shí)現(xiàn)。
3 系統(tǒng)體系結(jié)構(gòu)設(shè)計(jì)
本系統(tǒng)在語(yǔ)義網(wǎng)絡(luò)架構(gòu)下,用CIDOC CRM 作為數(shù)據(jù)描述
的基礎(chǔ)形成文物數(shù)據(jù)的語(yǔ)義表示,用Web Services[ 15 ]技術(shù)將物
理上分布的、異構(gòu)的各個(gè)地方博物館集成為一個(gè)虛擬的網(wǎng)上文
物博物館。
從邏輯上,虛擬文物博物館可分為三大部分:Web服務(wù)
層、中間層和用戶接口層。Web服務(wù)層是指各地?cái)?shù)字博物館
系統(tǒng)通過(guò)Web Services的接口提供的Web服務(wù);中間層主要包
括語(yǔ)義中間層、Web服務(wù)的注冊(cè)發(fā)現(xiàn)機(jī)制UDD I[ 16 ]、命令查詢
轉(zhuǎn)換、命令分發(fā)以及信息重組等模塊;而最上層是直接與用戶
交互的瀏覽器。系統(tǒng)總體結(jié)構(gòu)圖如圖5所示。
311 中間層
31111 語(yǔ)義層
(1) CIDOC CRM本體模型
由于文物的屬地特性,將分布于全國(guó)甚至是世界各地的文
物數(shù)據(jù)存放在一個(gè)系統(tǒng)里從技術(shù)上或者是經(jīng)濟(jì)上幾乎是不可能
的事。所以合理的解決方案應(yīng)該是通過(guò)中間系統(tǒng)使得物理上分
散的數(shù)據(jù)無(wú)縫連接成一個(gè)虛擬整體,支持查找等信息處理操作。
中間系統(tǒng)典型的設(shè)計(jì)是它接收并且解釋從用戶界面來(lái)的操作請(qǐng)
求,并把它分發(fā)給相應(yīng)的后臺(tái)系統(tǒng)中執(zhí)行;而相應(yīng)的后臺(tái)系統(tǒng)執(zhí)
行完請(qǐng)求,將返回結(jié)果匯總給用戶。但由于不同的后臺(tái)數(shù)字博
物館建立時(shí)所采用的數(shù)據(jù)結(jié)構(gòu)的差異,使得返回信息很難融合。
過(guò)去通常的解決辦法是通過(guò)設(shè)計(jì)一個(gè)統(tǒng)一數(shù)據(jù)格式來(lái)改造已有
的數(shù)據(jù),各個(gè)博物館的數(shù)據(jù)會(huì)有不同程度的丟失。這樣做顯然
不能很好地容納多個(gè)博物館數(shù)據(jù)的差異,而且數(shù)據(jù)之間的關(guān)系
也無(wú)法表達(dá)。更好的解決辦法是將各不相同的數(shù)據(jù)映射到一個(gè)
共同的基于本體語(yǔ)義模型,而這個(gè)模型的復(fù)雜程度可以容納博
強(qiáng)力推薦:
天柏客戶關(guān)系管理系統(tǒng)
天柏客戶關(guān)系管理系統(tǒng)(CRM)是一款集專業(yè)性、實(shí)用性、易用性為一體的純B/S架構(gòu)的CRM系統(tǒng),它基于以客戶為中心的協(xié)同管理思想和營(yíng)銷理念,圍繞客戶生命周期的整個(gè)過(guò)程,針對(duì)不同價(jià)值的客戶實(shí)施以客戶滿意為目標(biāo)的營(yíng)銷策略,通過(guò)企業(yè)級(jí)協(xié)同,有效的“發(fā)現(xiàn)、保持和留住客戶”,從而達(dá)到留住客戶、提高銷售,實(shí)現(xiàn)企業(yè)利潤(rùn)最大化的目的。通過(guò)對(duì)客戶進(jìn)行7P的深入分析,即客戶概況分析(Profiling)、客戶忠誠(chéng)度分析(Persistency)、客戶利潤(rùn)分析(Profitability)、客戶性能分析(Performance)、客戶未來(lái)分析(Prospecting)、客戶產(chǎn)品分析(Product)、客戶促銷分析(Promotion)以及改善與管理企業(yè)銷售、營(yíng)銷、客戶服務(wù)和支持等與客戶關(guān)系有關(guān)的業(yè)務(wù)流程并提高各個(gè)環(huán)節(jié)的自動(dòng)化程度,從而幫助企業(yè)達(dá)到縮短銷售周期、降低銷售成本、擴(kuò)大銷售量、增加收入與盈利、搶占更多市場(chǎng)份額、尋求新的市場(chǎng)機(jī)會(huì)和銷售渠道,最終從根本上提升企業(yè)的核心競(jìng)爭(zhēng)力,使得企業(yè)在當(dāng)前激烈的競(jìng)爭(zhēng)環(huán)境中立于不敗之地。
關(guān)鍵詞:CRM,CRM系統(tǒng),CRM軟件,客戶關(guān)系管理,客戶管理軟件,客戶管理系統(tǒng),客戶關(guān)系管理軟件,客戶關(guān)系管理系統(tǒng)