-
當(dāng)前位置:首頁(yè) > 創(chuàng)意學(xué)院 > 技術(shù) > 專(zhuān)題列表 > 正文
關(guān)聯(lián)分析的目的(關(guān)聯(lián)分析的目的和意義)
大家好!今天讓創(chuàng)意嶺的小編來(lái)大家介紹下關(guān)于關(guān)聯(lián)分析的目的的問(wèn)題,以下是小編對(duì)此問(wèn)題的歸納整理,讓我們一起來(lái)看看吧。
開(kāi)始之前先推薦一個(gè)非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫(xiě)出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁(yè)版、PC客戶端
官網(wǎng):https://ai.de1919.com
本文目錄:
一、數(shù)據(jù)挖掘的經(jīng)典算法
1. C4.5:是機(jī)器學(xué)習(xí)算法中的一種分類(lèi)決策樹(shù)算法,其核心算法是ID3算法。
2. K-means算法:是一種聚類(lèi)算法。
3.SVM:一種監(jiān)督式學(xué)習(xí)的方法,廣泛運(yùn)用于統(tǒng)計(jì)分類(lèi)以及回歸分析中
4.Apriori :是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法。
5.EM:最大期望值法。
6.pagerank:是google算法的重要內(nèi)容。
7. Adaboost:是一種迭代算法,其核心思想是針對(duì)同一個(gè)訓(xùn)練集訓(xùn)練不同的分類(lèi)器然后把弱分類(lèi)器集合起來(lái),構(gòu)成一個(gè)更強(qiáng)的最終分類(lèi)器。
8.KNN:是一個(gè)理論上比較成熟的的方法,也是最簡(jiǎn)單的機(jī)器學(xué)習(xí)方法之一。
9.Naive Bayes:在眾多分類(lèi)方法中,應(yīng)用最廣泛的有決策樹(shù)模型和樸素貝葉斯(Naive Bayes)
10.Cart:分類(lèi)與回歸樹(shù),在分類(lèi)樹(shù)下面有兩個(gè)關(guān)鍵的思想,第一個(gè)是關(guān)于遞歸地劃分自變量空間的想法,第二個(gè)是用驗(yàn)證數(shù)據(jù)進(jìn)行減枝。
關(guān)聯(lián)規(guī)則規(guī)則定義
在描述有關(guān)關(guān)聯(lián)規(guī)則的一些細(xì)節(jié)之前,我們先來(lái)看一個(gè)有趣的故事: 尿布與啤酒的故事。
在一家超市里,有一個(gè)有趣的現(xiàn)象:尿布和啤酒赫然擺在一起出售。但是這個(gè)奇怪的舉措?yún)s使尿布和啤酒的銷(xiāo)量雙雙增加了。這不是一個(gè)笑話,而是發(fā)生在美國(guó)沃爾瑪連鎖店超市的真實(shí)案例,并一直為商家所津津樂(lè)道。沃爾瑪擁有世界上最大的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),為了能夠準(zhǔn)確了解顧客在其門(mén)店的購(gòu)買(mǎi)習(xí)慣,沃爾瑪對(duì)其顧客的購(gòu)物行為進(jìn)行購(gòu)物籃分析,想知道顧客經(jīng)常一起購(gòu)買(mǎi)的商品有哪些。沃爾瑪數(shù)據(jù)倉(cāng)庫(kù)里集中了其各門(mén)店的詳細(xì)原始交易數(shù)據(jù)。在這些原始交易數(shù)據(jù)的基礎(chǔ)上,沃爾瑪利用數(shù)據(jù)挖掘方法對(duì)這些數(shù)據(jù)進(jìn)行分析和挖掘。一個(gè)意外的發(fā)現(xiàn)是:跟尿布一起購(gòu)買(mǎi)最多的商品竟是啤酒!經(jīng)過(guò)大量實(shí)際調(diào)查和分析,揭示了一個(gè)隱藏在尿布與啤酒背后的美國(guó)人的一種行為模式:在美國(guó),一些年輕的父親下班后經(jīng)常要到超市去買(mǎi)嬰兒尿布,而他們中有30%~40%的人同時(shí)也為自己買(mǎi)一些啤酒。產(chǎn)生這一現(xiàn)象的原因是:美國(guó)的太太們常叮囑她們的丈夫下班后為小孩買(mǎi)尿布,而丈夫們?cè)谫I(mǎi)尿布后又隨手帶回了他們喜歡的啤酒。
按常規(guī)思維,尿布與啤酒風(fēng)馬牛不相及,若不是借助數(shù)據(jù)挖掘技術(shù)對(duì)大量交易數(shù)據(jù)進(jìn)行挖掘分析,沃爾瑪是不可能發(fā)現(xiàn)數(shù)據(jù)內(nèi)在這一有價(jià)值的規(guī)律的。
數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中存在的一類(lèi)重要的可被發(fā)現(xiàn)的知識(shí)。若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,就稱(chēng)為關(guān)聯(lián)。關(guān)聯(lián)可分為簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)網(wǎng)。有時(shí)并不知道數(shù)據(jù)庫(kù)中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使知道也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。關(guān)聯(lián)規(guī)則挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系。Agrawal等于1993年首先提出了挖掘顧客交易數(shù)據(jù)庫(kù)中項(xiàng)集間的關(guān)聯(lián)規(guī)則問(wèn)題,以后諸多的研究人員對(duì)關(guān)聯(lián)規(guī)則的挖掘問(wèn)題進(jìn)行了大量的研究。他們的工作包括對(duì)原有的算法進(jìn)行優(yōu)化,如引入隨機(jī)采樣、并行的思想等,以提高算法挖掘規(guī)則的效率;對(duì)關(guān)聯(lián)規(guī)則的應(yīng)用進(jìn)行推廣。關(guān)聯(lián)規(guī)則挖掘在數(shù)據(jù)挖掘中是一個(gè)重要的課題,最近幾年已被業(yè)界所廣泛研究。
二、量化投資的主要方法和前沿進(jìn)展
量化投資是通過(guò)計(jì)算機(jī)對(duì)金融大數(shù)據(jù)進(jìn)行量化分析的基礎(chǔ)上產(chǎn)生交易決策機(jī)制。設(shè)計(jì)金融數(shù)學(xué)和計(jì)算機(jī)的知識(shí)和技術(shù),主要有人工智能、數(shù)據(jù)挖掘、小波分析、支持向量機(jī)、分形理論和隨機(jī)過(guò)程這幾種。
1.人工智能
人工智能(Artificial Intelligence,AI)是研究使用計(jì)算機(jī)來(lái)模擬人的某些思維過(guò)程和智能行為(如學(xué)習(xí)、推理、思考、規(guī)劃等)的學(xué)科,主要包括計(jì)算機(jī)實(shí)現(xiàn)智能的原理、制造類(lèi)似于人腦智能的計(jì)算機(jī),使計(jì)算機(jī)能實(shí)現(xiàn)更高層次的應(yīng)用。人工智能將涉及計(jì)算機(jī)科學(xué)、心理學(xué)、哲學(xué)和語(yǔ)言學(xué)等學(xué)科,可以說(shuō)幾乎是自然科學(xué)和社會(huì)科學(xué)的所有學(xué)科,其范圍已遠(yuǎn)遠(yuǎn)超出了計(jì)算機(jī)科學(xué)的范疇,人工智能與思維科學(xué)的關(guān)系是實(shí)踐和理論的關(guān)系,人工智能是處于思維科學(xué)的技術(shù)應(yīng)用層次,是它的一個(gè)應(yīng)用分支。
從思維觀點(diǎn)看,人工智能不僅限于邏輯思維,還要考慮形象思維、靈感思維才能促進(jìn)人工智能的突破性發(fā)展,數(shù)學(xué)常被認(rèn)為是多種學(xué)科的基礎(chǔ)科學(xué),因此人工智能學(xué)科也必須借用數(shù)學(xué)工具。數(shù)學(xué)不僅在標(biāo)準(zhǔn)邏輯、模糊數(shù)學(xué)等范圍發(fā)揮作用,進(jìn)入人工智能學(xué)科后也能促進(jìn)其得到更快的發(fā)展。
金融投資是一項(xiàng)復(fù)雜的、綜合了各種知識(shí)與技術(shù)的學(xué)科,對(duì)智能的要求非常高。所以人工智能的很多技術(shù)可以用于量化投資分析中,包括專(zhuān)家系統(tǒng)、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、遺傳算法等。
2.?dāng)?shù)據(jù)挖掘
數(shù)據(jù)挖掘(Data Mining)是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識(shí)的過(guò)程。
與數(shù)據(jù)挖掘相近的同義詞有數(shù)據(jù)融合、數(shù)據(jù)分析和決策支持等。在量化投資中,數(shù)據(jù)挖掘的主要技術(shù)包括關(guān)聯(lián)分析、分類(lèi)/預(yù)測(cè)、聚類(lèi)分析等。
關(guān)聯(lián)分析是研究?jī)蓚€(gè)或兩個(gè)以上變量的取值之間存在某種規(guī)律性。例如,研究股票的某些因子發(fā)生變化后,對(duì)未來(lái)一段時(shí)間股價(jià)之間的關(guān)聯(lián)關(guān)系。關(guān)聯(lián)分為簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)和因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)網(wǎng)。一般用支持度和可信度兩個(gè)閾值來(lái)度量關(guān)聯(lián)規(guī)則的相關(guān)性,還不斷引入興趣度、相關(guān)性等參數(shù),使得所挖掘的規(guī)則更符合需求。
分類(lèi)就是找出一個(gè)類(lèi)別的概念描述,它代表了這類(lèi)數(shù)據(jù)的整體信息,即該類(lèi)的內(nèi)涵描述,并用這種描述來(lái)構(gòu)造模型,一般用規(guī)則或決策樹(shù)模式表示。分類(lèi)是利用訓(xùn)練數(shù)據(jù)集通過(guò)一定的算法而求得分類(lèi)規(guī)則。分類(lèi)可被用于規(guī)則描述和預(yù)測(cè)。
預(yù)測(cè)是利用歷史數(shù)據(jù)找出變化規(guī)律,建立模型,并由此模型對(duì)未來(lái)數(shù)據(jù)的種類(lèi)及特征進(jìn)行預(yù)測(cè)。預(yù)測(cè)關(guān)心的是精度和不確定性,通常用預(yù)測(cè)方差來(lái)度量。
聚類(lèi)就是利用數(shù)據(jù)的相似性判斷出數(shù)據(jù)的聚合程度,使得同一個(gè)類(lèi)別中的數(shù)據(jù)盡可能相似,不同類(lèi)別的數(shù)據(jù)盡可能相異。
3.小波分析
小波(Wavelet)這一術(shù)語(yǔ),顧名思義,小波就是小的波形。所謂“小”是指它具有衰減性;而稱(chēng)之為“波”則是指它的波動(dòng)性,其振幅正負(fù)相間的震蕩形式。與傅里葉變換相比,小波變換是時(shí)間(空間)頻率的局部化分析,它通過(guò)伸縮平移運(yùn)算對(duì)信號(hào)(函數(shù))逐步進(jìn)行多尺度細(xì)化,最終達(dá)到高頻處時(shí)間細(xì)分,低頻處頻率細(xì)分,能自動(dòng)適應(yīng)時(shí)頻信號(hào)分析的要求,從而可聚焦到信號(hào)的任意細(xì)節(jié),解決了傅里葉變換的困難問(wèn)題,成為繼傅里葉變換以來(lái)在科學(xué)方法上的重大突破,因此也有人把小波變換稱(chēng)為數(shù)學(xué)顯微鏡。
小波分析在量化投資中的主要作用是進(jìn)行波形處理。任何投資品種的走勢(shì)都可以看做是一種波形,其中包含了很多噪音信號(hào)。利用小波分析,可以進(jìn)行波形的去噪、重構(gòu)、診斷、識(shí)別等,從而實(shí)現(xiàn)對(duì)未來(lái)走勢(shì)的判斷。
4.支持向量機(jī)
支持向量機(jī)(Support Vector Machine,SVM)方法是通過(guò)一個(gè)非線性映射,把樣本空間映射到一個(gè)高維乃至無(wú)窮維的特征空間中(Hilbert空間),使得在原來(lái)的樣本空間中非線性可分的問(wèn)題轉(zhuǎn)化為在特征空間中的線性可分的問(wèn)題,簡(jiǎn)單地說(shuō),就是升維和線性化。升維就是把樣本向高維空間做映射,一般情況下這會(huì)增加計(jì)算的復(fù)雜性,甚至?xí)鹁S數(shù)災(zāi)難,因而人們很少問(wèn)津。但是作為分類(lèi)、回歸等問(wèn)題來(lái)說(shuō),很可能在低維樣本空間無(wú)法線性處理的樣本集,在高維特征空間中卻可以通過(guò)一個(gè)線性超平面實(shí)現(xiàn)線性劃分(或回歸)。
一般的升維都會(huì)帶來(lái)計(jì)算的復(fù)雜化,SVM方法巧妙地解決了這個(gè)難題:應(yīng)用核函數(shù)的展開(kāi)定理,就不需要知道非線性映射的顯式表達(dá)式;由于是在高維特征空間中建立線性學(xué)習(xí)機(jī),所以與線性模型相比,不但幾乎不增加計(jì)算的復(fù)雜性,而且在某種程度上避免了維數(shù)災(zāi)難。這一切要?dú)w功于核函數(shù)的展開(kāi)和計(jì)算理論。
正因?yàn)橛羞@個(gè)優(yōu)勢(shì),使得SVM特別適合于進(jìn)行有關(guān)分類(lèi)和預(yù)測(cè)問(wèn)題的處理,這就使得它在量化投資中有了很大的用武之地。
5.分形理論
被譽(yù)為大自然的幾何學(xué)的分形理論(Fractal),是現(xiàn)代數(shù)學(xué)的一個(gè)新分支,但其本質(zhì)卻是一種新的世界觀和方法論。它與動(dòng)力系統(tǒng)的混沌理論交叉結(jié)合,相輔相成。它承認(rèn)世界的局部可能在一定條件下,在某一方面(形態(tài)、結(jié)構(gòu)、信息、功能、時(shí)間、能量等)表現(xiàn)出與整體的相似性,它承認(rèn)空間維數(shù)的變化既可以是離散的也可以是連續(xù)的,因而極大地拓展了研究視野。
自相似原則和迭代生成原則是分形理論的重要原則。它表示分形在通常的幾何變換下具有不變性,即標(biāo)度無(wú)關(guān)性。分形形體中的自相似性可以是完全相同的,也可以是統(tǒng)計(jì)意義上的相似。迭代生成原則是指可以從局部的分形通過(guò)某種遞歸方法生成更大的整體圖形。
分形理論既是非線性科學(xué)的前沿和重要分支,又是一門(mén)新興的橫斷學(xué)科。作為一種方法論和認(rèn)識(shí)論,其啟示是多方面的:一是分形整體與局部形態(tài)的相似,啟發(fā)人們通過(guò)認(rèn)識(shí)部分來(lái)認(rèn)識(shí)整體,從有限中認(rèn)識(shí)無(wú)限;二是分形揭示了介于整體與部分、有序與無(wú)序、復(fù)雜與簡(jiǎn)單之間的新形態(tài)、新秩序;三是分形從一特定層面揭示了世界普遍聯(lián)系和統(tǒng)一的圖景。
由于這種特征,使得分形理論在量化投資中得到了廣泛的應(yīng)用,主要可以用于金融時(shí)序數(shù)列的分解與重構(gòu),并在此基礎(chǔ)上進(jìn)行數(shù)列的預(yù)測(cè)。
6.隨機(jī)過(guò)程
隨機(jī)過(guò)程(Stochastic Process)是一連串隨機(jī)事件動(dòng)態(tài)關(guān)系的定量描述。隨機(jī)過(guò)程論與其他數(shù)學(xué)分支如位勢(shì)論、微分方程、力學(xué)及復(fù)變函數(shù)論等有密切的聯(lián)系,是在自然科學(xué)、工程科學(xué)及社會(huì)科學(xué)各領(lǐng)域中研究隨機(jī)現(xiàn)象的重要工具。隨機(jī)過(guò)程論目前已得到廣泛的應(yīng)用,在諸如天氣預(yù)報(bào)、統(tǒng)計(jì)物理、天體物理、運(yùn)籌決策、經(jīng)濟(jì)數(shù)學(xué)、安全科學(xué)、人口理論、可靠性及計(jì)算機(jī)科學(xué)等很多領(lǐng)域都要經(jīng)常用到隨機(jī)過(guò)程的理論來(lái)建立數(shù)學(xué)模型。
研究隨機(jī)過(guò)程的方法多種多樣,主要可以分為兩大類(lèi):一類(lèi)是概率方法,其中用到軌道性質(zhì)、隨機(jī)微分方程等;另一類(lèi)是分析的方法,其中用到測(cè)度論、微分方程、半群理論、函數(shù)堆和希爾伯特空間等,實(shí)際研究中常常兩種方法并用。另外組合方法和代數(shù)方法在某些特殊隨機(jī)過(guò)程的研究中也有一定作用。研究的主要內(nèi)容有:多指標(biāo)隨機(jī)過(guò)程、無(wú)窮質(zhì)點(diǎn)與馬爾科夫過(guò)程、概率與位勢(shì)及各種特殊過(guò)程的專(zhuān)題討論等。
其中,馬爾科夫過(guò)程很適于金融時(shí)序數(shù)列的預(yù)測(cè),是在量化投資中的典型應(yīng)用。
現(xiàn)階段量化投資在基金投資方面使用的比較多,也有部分投資機(jī)構(gòu)合券商的交易系統(tǒng)應(yīng)用了智能選股的技術(shù)。
三、數(shù)據(jù)挖掘技術(shù)與客戶關(guān)系管理的應(yīng)用綜述
數(shù)據(jù)挖掘技術(shù)與客戶關(guān)系管理的應(yīng)用綜述
企業(yè)通過(guò)實(shí)施客戶關(guān)系管理,可以降低成本,增加收入,提高業(yè)務(wù)運(yùn)作效率。對(duì)于每一個(gè)面臨競(jìng)爭(zhēng)的公司,數(shù)據(jù)倉(cāng)庫(kù)是必須最終擁有的市場(chǎng)武器。通過(guò)它可以更多地了解客戶的需求以及處理這些需求的方法。數(shù)據(jù)挖掘能夠?qū)?lái)的趨勢(shì)和行為進(jìn)行預(yù)測(cè),從而很好地支持人們的決策。作為專(zhuān)門(mén)管理企業(yè)前臺(tái)的客戶關(guān)系管理為企業(yè)提供了一個(gè)收集、分析和利用各種客戶信息的系統(tǒng),幫助企業(yè)充分利用其客戶管理資源,也為企業(yè)在電子商務(wù)時(shí)代從容自如地面對(duì)客戶提供了科學(xué)手段和方法。建立和維持客戶關(guān)系是取得競(jìng)爭(zhēng)優(yōu)勢(shì)的唯一的最重要的基礎(chǔ), 這是網(wǎng)絡(luò)化經(jīng)濟(jì)和電子商務(wù)對(duì)傳統(tǒng)商業(yè)模式變革的直接結(jié)果。
1 客戶關(guān)系管理(CRM)
1.1 內(nèi)容
CRM的概念由美國(guó)Gartner集團(tuán)率先提出。我們認(rèn)為,CRM是辨識(shí)、獲取、保持和增加“可獲利客戶”的理論、實(shí)踐和技術(shù)手段的總稱(chēng)。它既是一種國(guó)際領(lǐng)先的、以“客戶價(jià)值”為中心的企業(yè)管理理論、商業(yè)策略和企業(yè)運(yùn)作實(shí)踐,也是一種以信息技術(shù)為手段、有效提高企業(yè)收益、客戶滿意度、雇員生產(chǎn)力的管理軟件。
客戶關(guān)系管理(CRM)源于以“客戶為中心”的新型商業(yè)模式,是一種旨在改善企業(yè)與客戶之間關(guān)系的新型管理機(jī)制。通過(guò)向企業(yè)的銷(xiāo)售、市場(chǎng)和客戶服務(wù)的專(zhuān)業(yè)人士提供全面、個(gè)性化的客戶資料,并強(qiáng)化跟蹤服務(wù)、信息分析的能力,使他們能夠協(xié)同建立和維護(hù)一系列與客戶和生意伙伴之間卓有成效的“一對(duì)一關(guān)系”,使企業(yè)得以提供更快捷和周到的優(yōu)質(zhì)服務(wù)、提高客戶滿意度、吸引和保持更多的客戶,增加營(yíng)業(yè)額。通過(guò)信息共享和優(yōu)化商業(yè)流程有效地降低企業(yè)經(jīng)營(yíng)成本。
1.2 CRM解決方案的組成
CRM作為企業(yè)管理系統(tǒng)軟件,通常由以下三部分組成:
(1)網(wǎng)絡(luò)化銷(xiāo)售管理系統(tǒng)(Sales Distributor Management,SDM)。該模塊以市場(chǎng)和銷(xiāo)售業(yè)務(wù)為主導(dǎo),對(duì)銷(xiāo)售的流程進(jìn)行了詳細(xì)的管理,是銷(xiāo)售管理人員進(jìn)行管理和銷(xiāo)售業(yè)務(wù)員銷(xiāo)售自動(dòng)化的重要工具。它實(shí)現(xiàn)了銷(xiāo)售過(guò)程中對(duì)客戶的集中管理和協(xié)同管理,銷(xiāo)售管理人員可以隨時(shí)對(duì)銷(xiāo)售情況進(jìn)行分析,具體功能包括客戶接待管理、報(bào)價(jià)單處理、銷(xiāo)售合同管理、回款單處理、綜合查詢功能、綜合統(tǒng)計(jì)功能。
(2)客戶服務(wù)管理系統(tǒng)(Customer Service Management,CSM)。該模塊主要對(duì)企業(yè)的售后服務(wù)進(jìn)行管理,加快售后服務(wù)的響應(yīng)速度,提高客戶滿意度,對(duì)服務(wù)人員進(jìn)行考核,加強(qiáng)對(duì)產(chǎn)品質(zhì)量的監(jiān)督。
客戶服務(wù)系統(tǒng)最典型的代表就是呼叫中心環(huán)境,通過(guò)呼叫中心環(huán)境布署并且實(shí)現(xiàn)基于電話、Web的自助服務(wù)。它們使企業(yè)能夠以更快的速度和更高的效率來(lái)滿足其客戶的獨(dú)特需求。由于在多數(shù)情況下,客戶忠實(shí)度和是否能從該客戶身上贏利取決于企業(yè)能否提供優(yōu)質(zhì)的服務(wù),因此,客戶服務(wù)和支持對(duì)許多企業(yè)就變得十分關(guān)鍵。
(3)企業(yè)決策信息系統(tǒng)(Executive Information System,EIS)。隨著電子商務(wù)時(shí)代的到來(lái), 各行各業(yè)業(yè)務(wù)操作流程的自動(dòng)化,企業(yè)內(nèi)產(chǎn)生了數(shù)以幾十或上百GB計(jì)的大量業(yè)務(wù)數(shù)據(jù)。這些數(shù)據(jù)和由此產(chǎn)生的信息是企業(yè)的財(cái)富,它如實(shí)地記錄著企業(yè)運(yùn)作的本質(zhì)狀況。但是面對(duì)如此海量的數(shù)據(jù),迫使人們不斷尋找新的工具,來(lái)對(duì)企業(yè)的運(yùn)營(yíng)規(guī)律進(jìn)行探索,為商業(yè)決策提供有價(jià)值的知識(shí),使企業(yè)獲得利潤(rùn)。能滿足企業(yè)這一迫切需求的強(qiáng)有力的工具就是數(shù)據(jù)挖掘。
1.3 CRM的實(shí)施
CRM項(xiàng)目的實(shí)施可以分為3步:①應(yīng)用業(yè)務(wù)集成。將獨(dú)立的市場(chǎng)管理,銷(xiāo)售管理與售后服務(wù)進(jìn)行集成,提供統(tǒng)一的運(yùn)作平臺(tái)。將多渠道來(lái)源的數(shù)據(jù)進(jìn)行整合,實(shí)現(xiàn)業(yè)務(wù)數(shù)據(jù)的集成與共享;②業(yè)務(wù)數(shù)據(jù)分析。對(duì)CRM系統(tǒng)中的數(shù)據(jù)進(jìn)行加工、處理與分析這將使企業(yè)受益匪淺。對(duì)數(shù)據(jù)的分析可以采用OLAP的方式進(jìn)行,生成各類(lèi)報(bào)告。也可以采用業(yè)務(wù)數(shù)據(jù)倉(cāng)庫(kù)(Business Information Warehouse)的處理手段,對(duì)數(shù)據(jù)做進(jìn)一步的加工與數(shù)據(jù)挖掘,分析各數(shù)據(jù)指標(biāo)間的關(guān)聯(lián)關(guān)系,建立關(guān)聯(lián)性的數(shù)據(jù)模型用于模擬和預(yù)測(cè);③決策執(zhí)行。依據(jù)數(shù)據(jù)分析所提供的可預(yù)見(jiàn)性的分析報(bào)告,企業(yè)可以將在業(yè)務(wù)過(guò)程中所學(xué)到的知識(shí)加以總結(jié)利用,對(duì)業(yè)務(wù)過(guò)程和業(yè)務(wù)計(jì)劃等做出調(diào)整。[page] 2數(shù)據(jù)挖掘
2.1 什么是數(shù)據(jù)挖掘
數(shù)據(jù)挖掘(data mining)是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中獲取有效的、新穎的、潛在有用的、最終可理解模式的非平凡過(guò)程。數(shù)據(jù)挖掘的廣義觀點(diǎn):數(shù)據(jù)挖掘就是從存放在數(shù)據(jù)庫(kù),數(shù)據(jù)倉(cāng)庫(kù)或其它信息庫(kù)中的大量的數(shù)據(jù)中“挖掘”有趣知識(shí)的過(guò)程。數(shù)據(jù)挖掘,又稱(chēng)為數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database,KDD),也有人把數(shù)據(jù)挖掘視為數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)過(guò)程的一個(gè)基本步驟。知識(shí)發(fā)現(xiàn)過(guò)程由以下步驟組成:
①數(shù)據(jù)清理;②數(shù)據(jù)集成;③數(shù)據(jù)選擇;④數(shù)據(jù)變換;⑤數(shù)據(jù)挖掘;⑥模式評(píng)估;⑦知識(shí)表示。數(shù)據(jù)挖掘可以與用戶或知識(shí)庫(kù)交互。數(shù)據(jù)挖掘就是為順應(yīng)這種需要應(yīng)運(yùn)而生發(fā)展起來(lái)的數(shù)據(jù)處理技術(shù)。在客戶關(guān)系管理(CRM)中,數(shù)據(jù)挖掘的應(yīng)用是非常廣泛的。CRM中的客戶分類(lèi),客戶贏利率分析,客戶識(shí)別與客戶保留等功能都要借助數(shù)據(jù)挖掘來(lái)實(shí)現(xiàn)。
2.2數(shù)據(jù)挖掘在CRM中的應(yīng)用
比較典型的數(shù)據(jù)挖掘方法有關(guān)聯(lián)分析、序列模式分析、分類(lèi)分析、聚類(lèi)分析等。它們可以在以客戶為中心的企業(yè)決策分析和管理的各個(gè)不同領(lǐng)域與階段得到應(yīng)用。
2.2.1 關(guān)聯(lián)分析
關(guān)聯(lián)分析,即利用關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖掘。關(guān)聯(lián)分析的目的是挖掘隱藏在數(shù)據(jù)間的相互關(guān)系,它能發(fā)現(xiàn)數(shù)據(jù)庫(kù)中形如“90%的顧客在一次購(gòu)買(mǎi)活動(dòng)中購(gòu)買(mǎi)商品A的同時(shí)購(gòu)買(mǎi)商品B”之類(lèi)的知識(shí)。
2.2.2 序列模式分析
序列模式分析和關(guān)聯(lián)分析相似,但側(cè)重點(diǎn)在于分析數(shù)據(jù)間的前后序列關(guān)系。它能發(fā)現(xiàn)數(shù)據(jù)庫(kù)中形如“在某一段時(shí)間內(nèi),顧客購(gòu)買(mǎi)商品A,接著購(gòu)買(mǎi)商品B,而后購(gòu)買(mǎi)商品C,即序列A→B→C出現(xiàn)的頻度較高”之類(lèi)的知識(shí)。序列模式分析描述的問(wèn)題是:在給定交易序列數(shù)據(jù)庫(kù)中,每個(gè)序列是按照交易時(shí)間排列的一組交易集, 挖掘序列函數(shù)作用在這個(gè)交易序列數(shù)據(jù)庫(kù)上,返回該數(shù)據(jù)庫(kù)中出現(xiàn)的高頻序列。在進(jìn)行序列模式分析時(shí),同樣也需要由用戶輸入最小置信度C和最小支持度S。
2.2.3 分類(lèi)分析
設(shè)有一個(gè)數(shù)據(jù)庫(kù)和一組具有不同特征的類(lèi)別(標(biāo)記),該數(shù)據(jù)庫(kù)中的每一個(gè)記錄都賦予一個(gè)類(lèi)別的標(biāo)記,這樣的數(shù)據(jù)庫(kù)稱(chēng)為示例數(shù)據(jù)庫(kù)或訓(xùn)練集。分類(lèi)分析就是通過(guò)分析示例數(shù)據(jù)庫(kù)中的數(shù)據(jù),為每個(gè)類(lèi)別做出準(zhǔn)確的描述或建立分析模型或挖掘出分類(lèi)規(guī)則,然后用這個(gè)分類(lèi)規(guī)則對(duì)其它數(shù)據(jù)庫(kù)中的記錄進(jìn)行分類(lèi)。
2.2.4 聚類(lèi)分析
聚類(lèi)分析輸入的是一組未分類(lèi)記錄,并且這些記錄應(yīng)分成幾類(lèi)事先也不知道,通過(guò)分析數(shù)據(jù)庫(kù)中的記錄數(shù)據(jù),根據(jù)一定的分類(lèi)規(guī)則,合理地劃分記錄集合,確定每個(gè)記錄所在類(lèi)別。它所采用的分類(lèi)規(guī)則是由聚類(lèi)分析工具決定的。采用不同的聚類(lèi)方法,對(duì)于相同的記錄集合可能有不同的劃分結(jié)果。
3 結(jié)束語(yǔ)
應(yīng)用數(shù)據(jù)挖掘技術(shù),較為理想的起點(diǎn)就是從一個(gè)數(shù)據(jù)倉(cāng)庫(kù)開(kāi)始。這個(gè)數(shù)據(jù)倉(cāng)庫(kù),里面應(yīng)保存著所有客戶的合同信息,并且還應(yīng)該有相應(yīng)的市場(chǎng)競(jìng)爭(zhēng)對(duì)手的相關(guān)數(shù)據(jù)。數(shù)據(jù)挖掘可以直接跟蹤數(shù)據(jù),輔助用戶快速作出商業(yè)決策。用戶還可以在更新數(shù)據(jù)的時(shí)候不斷發(fā)現(xiàn)更好的行為模式,并將其運(yùn)用于未來(lái)的決策當(dāng)中。
四、如何做好關(guān)聯(lián)分析
關(guān)聯(lián)分析是指如果兩個(gè)或多個(gè)事物之間存在一定的關(guān)聯(lián),那么其中一個(gè)事物就能通過(guò)其他事物進(jìn)行預(yù)測(cè).它的目的是為了挖掘隱藏在數(shù)據(jù)間的相互關(guān)系
以上就是關(guān)于關(guān)聯(lián)分析的目的相關(guān)問(wèn)題的回答。希望能幫到你,如有更多相關(guān)問(wèn)題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。
推薦閱讀:
關(guān)聯(lián)促銷(xiāo)是什么意思(關(guān)聯(lián)促銷(xiāo)是什么意思呀)
三年級(jí)什么叫關(guān)聯(lián)詞語(yǔ)有哪些(三年級(jí)什么叫關(guān)聯(lián)詞語(yǔ)有哪些詞)
抖音極速版和抖音怎么綁定在一起(抖音極速版和抖音怎么關(guān)聯(lián))
七龍珠實(shí)力排行榜(七龍珠實(shí)力排行榜官方2020)
類(lèi)似金達(dá)萊花勁爆的歌曲(類(lèi)似金達(dá)萊花的戰(zhàn)歌)
猜你喜歡
怎樣在手機(jī)上發(fā)表說(shuō)說(shuō)(怎樣在手機(jī)上發(fā)表說(shuō)說(shuō)文案)
門(mén)店銷(xiāo)售接待流程(門(mén)店銷(xiāo)售接待流程怎么寫(xiě))
拼多多店鋪上不同類(lèi)目產(chǎn)品(拼多多店鋪上不同類(lèi)目產(chǎn)品不一樣)
高質(zhì)量發(fā)展和市場(chǎng)營(yíng)銷(xiāo)的關(guān)系(高質(zhì)量發(fā)展和市場(chǎng)營(yíng)銷(xiāo)的關(guān)系是)
網(wǎng)戰(zhàn)查詢(網(wǎng)戰(zhàn)查詢系統(tǒng))
快速排名優(yōu)化推廣價(jià)格(快速排名優(yōu)化推廣怎樣)