機器學習A-Z～先驗算法Apriori

本文將會講述關(guān)聯(lián)規(guī)則學習中的一個基本算法木柬，叫做先驗算法。所謂先驗算法入偷，就是找出不同事件之間的聯(lián)系追驴。比如一個人在超市買了產(chǎn)品A，他可能會買貨物B疏之。這里我們看一個例子殿雪。

image

這里有七筆交易，那么根據(jù)這些數(shù)據(jù)我們可以得出一些猜測锋爪，當有貨物A時可能有貨物B丙曙。比如有漢堡的時候可能有薯條，如果有蔬菜可能就有水果等等其骄。當我們的商店越來越大亏镰，交易記錄越來越多，那么通過人為觀察來看出這些商品之間的聯(lián)系就很難了拯爽，這時就需要用到先驗算法索抓。

概念

先驗算法當中有三個核心概念，support(支持度), confidence(信心水準), lift(提升度)毯炮。

先來看看支持度逼肯，比如交易的例子，對于一個商品I來說桃煎，那么就是所有包含商品I的交易數(shù)目除以總的交易數(shù)目篮幢。
$support(I) = \frac{transactions\quad containing\quad I}{transactions}$
第二個概念，信心水準为迈，這里I1表示商品1三椿，I2表示商品2，那么信心水準就是同時包含商品1和2的交易除以包含商品1的交易記錄個數(shù)葫辐。
$confidence(I_1 -> I_2) = \frac{transactions\quad containing\quad I_1\quad and\quad I_2}{transactions \quad containing \quad I_1}$
第三個概念赋续，提升度，這個和支持度和信心水準有關(guān),就是configdence/support另患。當這個提升度大于1時纽乱，我們可以認為商品 $I_1$ 對 $I_2$ 是有提升的。
$lift(I_1 -> I_2) = \frac{confidence(I_1->I_2)}{support(I_2)}$
那么現(xiàn)在做個總結(jié)昆箕，這個先驗算法主要可以分為四步：

設(shè)置一個最低的support和confidence
選擇所有support比剛剛設(shè)置的要大的商品
根據(jù)剛剛已經(jīng)選擇的商品鸦列，選擇所有比剛剛定義的最小confidence要高的所有規(guī)則的集合
把剛剛的規(guī)則從大到小排序，選出提升度最高的幾個鹏倘。

image

代碼實現(xiàn)

這次代碼實現(xiàn)我們使用一家商店如何使用先驗算法來提高銷量的例子薯嗤。這里有這家商店最近的所有交易，每個交易中分別賣出了不同種類的商品纤泵。

image

這次的代碼使用了一個額外的包骆姐，因此需要大家自己去看這個包里的代碼镜粤，這里只貼出如何使用這個包進行先驗算法的使用。

from apyori import apriori
import pandas as pd

dataset = pd.read_csv('Market_Basket_Optimisation.csv', header=None)
transactions = []
for i in range(0, 7501):
    transactions.append([str(dataset.values[i, j]) for j in range(0, 20)])

# Training Apriori on the dataset

rules = apriori(transactions, min_support=0.003, min_confidence=0.2, min_lift=3, min_length=2)

# Visualising the results
results = list(rules)
myResults = [list(x) for x in results]

這里的apyori包可以去我的github查看這部分代碼玻褪。以上肉渴，就是先驗算法的相關(guān)基礎(chǔ)知識。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末带射，一起剝皮案震驚了整個濱河市同规，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌窟社，老刑警劉巖券勺，帶你破解...
沈念sama閱讀 218,284評論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異灿里，居然都是意外死亡关炼，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,115評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門匣吊，熙熙樓的掌柜王于貴愁眉苦臉地迎上來盗扒，“玉大人，你說我怎么就攤上這事缀去。” “怎么了甸祭？”我有些...
開封第一講書人閱讀 164,614評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵缕碎，是天一觀的道長。經(jīng)常有香客問我池户，道長咏雌，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,671評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任校焦，我火速辦了婚禮赊抖，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘寨典。我一直安慰自己氛雪，他們只是感情好，可當我...
茶點故事閱讀 67,699評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布耸成。她就那樣靜靜地躺著报亩，像睡著了一般。火紅的嫁衣襯著肌膚如雪井氢。梳的紋絲不亂的頭發(fā)上弦追，一...
開封第一講書人閱讀 51,562評論 1贊 305
城市分裂傳說
那天，我揣著相機與錄音花竞，去河邊找鬼劲件。笑死，一個胖子當著我的面吹牛，可吹牛的內(nèi)容都是我干的零远。我是一名探鬼主播苗分，決...
沈念sama閱讀 40,309評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼遍烦！你這毒婦竟也來了俭嘁？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,223評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤服猪，失蹤者是張志新（化名）和其女友劉穎供填，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體罢猪，經(jīng)...
沈念sama閱讀 45,668評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡近她，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,859評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了膳帕。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片粘捎。...
茶點故事閱讀 39,981評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖危彩，靈堂內(nèi)的尸體忽然破棺而出攒磨，到底是詐尸還是另有隱情，我是刑警寧澤汤徽，帶...
沈念sama閱讀 35,705評論 5贊 347
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布娩缰，位于F島的核電站，受9級特大地震影響谒府，放射性物質(zhì)發(fā)生泄漏拼坎。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,310評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一完疫、第九天我趴在偏房一處隱蔽的房頂上張望泰鸡。院中可真熱鬧，春花似錦壳鹤、人聲如沸盛龄。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,904評論 0贊 22
一樁弒父案芳誓，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽讯嫂。三九已至，卻和暖如春兆沙，著一層夾襖步出監(jiān)牢的瞬間欧芽，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,023評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工葛圃，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留千扔，地道東北人憎妙。一個月前我還...
沈念sama閱讀 48,146評論 3贊 370
代替公主和親
正文我出身青樓，卻偏偏與公主長得像曲楚，于是被迫代替她去往敵國和親厘唾。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 44,933評論 2贊 355

機器學習A-Z～先驗算法Apriori

概念

代碼實現(xiàn)

推薦閱讀更多精彩內(nèi)容