AprioriAll算法總結(jié)
使用場景:
AprioriAll算法是在Apriori算法基礎(chǔ)上加入了時間序列的統(tǒng)計方法姑躲,使數(shù)據(jù)集之間多了時間序列上的關(guān)聯(lián)關(guān)系迎卤。
原理:
我們分五個具體階段來介紹基于上面概念發(fā)現(xiàn)序列模式的方法谷浅。這些步驟分別是排序階段涂滴、大項集階段胆建、轉(zhuǎn)換階段街州、序列階段以及選最大階段兼丰。
-
排序階段
?對數(shù)據(jù)庫進行排序(Sort)绰咽,排序的結(jié)果將原始的數(shù)據(jù)庫轉(zhuǎn)換成序列數(shù)據(jù)庫。
-
大項集階段
?這個階段要找出所有頻繁的項集(即大項集)組成的集合L地粪。(使用支持度閾值篩選取募,然后用算出從一階到多階的支持度)
根據(jù)數(shù)據(jù)集,統(tǒng)計符合最低閾值的頻繁項蟆技,轉(zhuǎn)成map
-
轉(zhuǎn)換階段
? 用最大頻度項玩敏,替換原來的數(shù)據(jù)集,得到新的數(shù)據(jù)集质礼,低頻率的項將會被刪除旺聚。
序列階段
?對轉(zhuǎn)換完的數(shù)據(jù)眶蕉,在進行一次砰粹,大于最小支持度閾值的篩選,從一階到多階造挽。選最大階段
?在大序列集中找出最長序列(Maximal Sequences)碱璃。
偽碼:
如需源碼,請私信我饭入。
參考資料1:https://blog.csdn.net/qq_25269795/article/details/84202263
參考資料2:https://blog.csdn.net/WeeYang/article/details/52793864