數(shù)據(jù)挖掘案例分析(1)-Apriori算法

數(shù)據(jù)挖掘案例分析(1)-Apriori算法

前言:由于單單學(xué)習(xí)算法太過于枯燥和乏味,所以我們采取的學(xué)習(xí)方法是練中學(xué)召嘶,本人也是之前一點(diǎn)關(guān)于數(shù)據(jù)挖掘的算法知識沒有學(xué)習(xí),因此可能在理解上還不是很到位哮缺,我會盡我最大的努力來進(jìn)行闡述苍蔬。我們一起共勉。學(xué)習(xí)資料來源蝴蜓,《數(shù)據(jù)挖掘十大算法》-清華大學(xué)和《數(shù)據(jù)挖掘?qū)嵱冒咐治觥罚瓩C(jī)械工業(yè)出版社。

案例:商業(yè)零售業(yè)中的購物籃分析

一俺猿、挖掘目標(biāo)的提出

零售商的問題:

銷售什么樣子的商品茎匠?

采取什么樣的銷售策略和促銷方式?

商品在貨架上的擺放位置押袍?

針對以上的問題诵冒,我們需要分析客戶的購買數(shù)據(jù),才能發(fā)現(xiàn)顧客的購買規(guī)律谊惭。所以基于問題的分析汽馋,我們明確了數(shù)據(jù)來源。那么我們明確了數(shù)據(jù)的來源圈盔,對這些數(shù)據(jù)該采取什么樣的分析方法才能達(dá)到我們想要完成的目標(biāo)豹芯。

二、分析方法與過程

根據(jù)所要實(shí)現(xiàn)的目標(biāo)挥下,我們先來介紹一個經(jīng)典的關(guān)聯(lián)規(guī)則挖掘算法:Apriori算法递雀。

Apriori算法:關(guān)聯(lián)規(guī)則挖掘問題可以劃分為兩個子問題:第一是找出事務(wù)數(shù)據(jù)庫中所有大于等于用戶指定的最小支持度的數(shù)據(jù)項集排吴;第二個是利用頻繁項集生成所需要的關(guān)聯(lián)規(guī)則。根據(jù)用戶設(shè)定的最小置信度進(jìn)行取舍握牧,最后得到強(qiáng)關(guān)聯(lián)規(guī)則。識別或發(fā)現(xiàn)所有頻繁項目集是關(guān)聯(lián)規(guī)則發(fā)現(xiàn)算法的核心娩梨。

主要步驟:


其中在這個算法中沿腰,為了達(dá)到用戶的一定要求,需要指定規(guī)則必須滿足的支持度和置信度閾值狈定,此兩個值稱為最小支持度閾值(min_sup)和最小置信度閾值(min_conf)颂龙。其中min_sup描述了關(guān)聯(lián)規(guī)則的最低重要度,min_conf規(guī)定了關(guān)聯(lián)規(guī)則必須滿足的最低可靠性掸冤。

具體的簡單應(yīng)用讀者可以自己自行從網(wǎng)上找取資源厘托。

下面我們來總結(jié)一下Apriori算法的優(yōu)缺點(diǎn):


Apriori算法應(yīng)用的領(lǐng)域多樣,其中主要包括:商業(yè)稿湿、網(wǎng)絡(luò)安全铅匹、高效管理和移動通信等領(lǐng)域的應(yīng)用。

介紹完Apriori算法之后饺藤,我們回歸我們的案例分析包斑,基于關(guān)聯(lián)規(guī)則的購物籃分析流礁。那么關(guān)聯(lián)規(guī)則的挖掘過程如圖:


三、建模仿真

1模型輸入

模型的輸入包括兩部分罗丰,一部分是建模專家樣本數(shù)據(jù)的輸入神帅,另外一部分是建模參數(shù)的輸入。

建模參數(shù)如下表:


2具體的仿真過程:


經(jīng)過上述的分析萌抵,我們可以發(fā)現(xiàn)找御,在彼此不同的屬性之間,可以發(fā)現(xiàn)它們之間的關(guān)聯(lián)規(guī)則绍填,這有利于我們進(jìn)行商品定價和商品的擺放霎桅。合理的制定消費(fèi)策略

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市讨永,隨后出現(xiàn)的幾起案子滔驶,更是在濱河造成了極大的恐慌,老刑警劉巖卿闹,帶你破解...
    沈念sama閱讀 211,194評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件揭糕,死亡現(xiàn)場離奇詭異,居然都是意外死亡锻霎,警方通過查閱死者的電腦和手機(jī)著角,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,058評論 2 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來量窘,“玉大人雇寇,你說我怎么就攤上這事“鐾” “怎么了锨侯?”我有些...
    開封第一講書人閱讀 156,780評論 0 346
  • 文/不壞的土叔 我叫張陵,是天一觀的道長冬殃。 經(jīng)常有香客問我囚痴,道長,這世上最難降的妖魔是什么审葬? 我笑而不...
    開封第一講書人閱讀 56,388評論 1 283
  • 正文 為了忘掉前任深滚,我火速辦了婚禮,結(jié)果婚禮上涣觉,老公的妹妹穿的比我還像新娘痴荐。我一直安慰自己,他們只是感情好官册,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,430評論 5 384
  • 文/花漫 我一把揭開白布生兆。 她就那樣靜靜地躺著,像睡著了一般膝宁。 火紅的嫁衣襯著肌膚如雪鸦难。 梳的紋絲不亂的頭發(fā)上根吁,一...
    開封第一講書人閱讀 49,764評論 1 290
  • 那天,我揣著相機(jī)與錄音合蔽,去河邊找鬼击敌。 笑死,一個胖子當(dāng)著我的面吹牛拴事,可吹牛的內(nèi)容都是我干的沃斤。 我是一名探鬼主播,決...
    沈念sama閱讀 38,907評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼刃宵,長吁一口氣:“原來是場噩夢啊……” “哼轰枝!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起组去,我...
    開封第一講書人閱讀 37,679評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎步淹,沒想到半個月后从隆,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,122評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡缭裆,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,459評論 2 325
  • 正文 我和宋清朗相戀三年键闺,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片澈驼。...
    茶點(diǎn)故事閱讀 38,605評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡辛燥,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出缝其,到底是詐尸還是另有隱情挎塌,我是刑警寧澤,帶...
    沈念sama閱讀 34,270評論 4 329
  • 正文 年R本政府宣布内边,位于F島的核電站榴都,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏漠其。R本人自食惡果不足惜嘴高,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,867評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望和屎。 院中可真熱鬧拴驮,春花似錦、人聲如沸柴信。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,734評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽颠印。三九已至纲岭,卻和暖如春抹竹,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背止潮。 一陣腳步聲響...
    開封第一講書人閱讀 31,961評論 1 265
  • 我被黑心中介騙來泰國打工窃判, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人喇闸。 一個月前我還...
    沈念sama閱讀 46,297評論 2 360
  • 正文 我出身青樓袄琳,卻偏偏與公主長得像,于是被迫代替她去往敵國和親燃乍。 傳聞我的和親對象是個殘疾皇子唆樊,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,472評論 2 348

推薦閱讀更多精彩內(nèi)容