數(shù)據(jù)挖掘彻犁,已成為各大公司的必備職位叫胁,針對(duì)顧客行為和購買歷史等進(jìn)行數(shù)據(jù)整合、分析挖掘汞幢,達(dá)到精準(zhǔn)定位營(yíng)銷的目的驼鹅。但數(shù)據(jù)挖掘并不是簡(jiǎn)單的數(shù)據(jù)采編,更多需要一些算法技巧森篷,比如我們做數(shù)據(jù)挖掘會(huì)采用分類算法输钩、聚類算法、關(guān)聯(lián)規(guī)則等仲智。下面大圣眾包威客平臺(tái)小編就這三種算法詳細(xì)介紹下买乃,如何實(shí)現(xiàn)精準(zhǔn)營(yíng)銷。
分類算法:
我們做電商平臺(tái)钓辆,用戶留存是很重要的一部分剪验,但顧客流失走向我們是無法控制的肴焊,只能通過預(yù)測(cè),這時(shí)就需要運(yùn)用到分類模型功戚。分類算法屬于預(yù)測(cè)性模型娶眷,根據(jù)過去數(shù)據(jù)、分析來預(yù)測(cè)將來一段時(shí)間的行為過程啸臀。分類學(xué)習(xí)方法所使用的數(shù)據(jù)集稱為訓(xùn)練集茂浮,訓(xùn)練集中每一個(gè)個(gè)體都有明確的類別,通過訓(xùn)練集中的數(shù)據(jù)表現(xiàn)出來的特征壳咕,為每一個(gè)類找到一種準(zhǔn)確的描述或者模型席揽。其優(yōu)點(diǎn)是容易理解、預(yù)測(cè)準(zhǔn)確度高谓厘。分類算法有l(wèi)ogistic回歸幌羞,神經(jīng)網(wǎng)絡(luò)、貝葉斯分類器竟稳、SVM等算法属桦。
分類算法實(shí)際應(yīng)用案例:
比如高爾夫球場(chǎng),這個(gè)跟天氣情況關(guān)系密切他爸,因?yàn)榍捌诘臄?shù)據(jù)分析聂宾,得出天氣是否晴朗,氣溫如何诊笤,濕度如何系谐、風(fēng)力如何都會(huì)影響到打高爾夫球場(chǎng)的人,因此讨跟,作為一個(gè)高爾夫球場(chǎng)的運(yùn)營(yíng)人員便可以根據(jù)分類模型纪他,去構(gòu)建決策樹,不同的天氣因素晾匠,決定是否開放等茶袒。
聚類算法:
說完分類算法,談?wù)劸垲惲构荩垲愃惴ㄖ饕前凑諛颖拘皆ⅰ?shù)據(jù)自身的屬性去歸類,用數(shù)學(xué)方法根據(jù)相似性或差異性指標(biāo)澜共,定量確定樣本親疏關(guān)系向叉。聚類有Kmeas,Two-step
聚類算法實(shí)際應(yīng)用案例:
電商公司想要新進(jìn)一批高端服裝咳胃,但究竟進(jìn)什么款式等植康,這需要根據(jù)消費(fèi)群體特征來分類旷太,首先需要從上一年的數(shù)據(jù)展懈,查看顧客購買行為销睁、消費(fèi)額、購買時(shí)間等通過聚類方法進(jìn)行分類存崖,找出每類群體的特征冻记,然后根據(jù)這類群體進(jìn)行相應(yīng)的推送,而不是廣撒網(wǎng)模式来惧。
關(guān)聯(lián)規(guī)則:
關(guān)聯(lián)分析是從大量數(shù)據(jù)中發(fā)現(xiàn)樣本之間有趣的關(guān)聯(lián)和關(guān)系冗栗,從而為用戶推送。關(guān)聯(lián)分析主要用“支持度”(support)和“置性度”(confidence)兩個(gè)概念衡量事物之間的關(guān)聯(lián)規(guī)則供搀。關(guān)聯(lián)規(guī)則A->B的支持度support=P(AB)隅居,指的是事件A和事件B同時(shí)發(fā)生的概率。置信度confidence=P(B|A)=P(AB)/P(A),指的是發(fā)生事件A的基礎(chǔ)上發(fā)生事件B的概率葛虐。這有點(diǎn)像我們高中的概率學(xué)胎源。
我們常見的電商平臺(tái),“為你推薦”屿脐、“購買該產(chǎn)品的用戶還購買了”等都屬于關(guān)聯(lián)分析涕蚤,其依據(jù)就是通過分析之前購買產(chǎn)品的顧客的購物籃分析,分析顧客的購買習(xí)慣的诵,可以幫助零售商制定營(yíng)銷策略万栅。
數(shù)據(jù)挖掘不是簡(jiǎn)單的數(shù)據(jù)整合,采集西疤,更多是根據(jù)用戶的行為習(xí)慣烦粒,深入分析用戶的意圖,了解背后的動(dòng)機(jī)代赁,才能給予企業(yè)決策撒遣,更好服務(wù)營(yíng)銷。