神一樣的產(chǎn)品經(jīng)理-數(shù)據(jù)挖掘模型

常見(jiàn)挖掘模型有以下幾類(lèi):

1 聚類(lèi)

聚類(lèi)(Clustering)是根據(jù)特定的標(biāo)準(zhǔn)將數(shù)據(jù)劃分為不同的組子房。

聚類(lèi)和分類(lèi)(Classification)的不同在于:聚類(lèi)并不決定于事先定義好的種類(lèi)。

聚類(lèi)是一種強(qiáng)大的間接知識(shí)發(fā)現(xiàn)的技術(shù),它大大降低了數(shù)據(jù)的復(fù)雜性晾嘶,提高了數(shù)據(jù)挖掘成功的可能性号醉。

聚類(lèi)產(chǎn)生的結(jié)果也需要人們?nèi)ソ忉尯屠斫庀さ帧>垲?lèi)是將物理或抽象對(duì)象的集合組成為由類(lèi)似的對(duì)象組成的多個(gè)類(lèi)的過(guò)程岭皂。

聚類(lèi)算法應(yīng)用很廣泛,比如簿透,聚類(lèi)能幫助市場(chǎng)分析人員從用戶(hù)基本信息庫(kù)中發(fā)現(xiàn)不同的用戶(hù)群移袍,有利于用戶(hù)的細(xì)分,并且用不同的購(gòu)買(mǎi)模式來(lái)刻畫(huà)不同的消費(fèi)群體的特征老充。

2 關(guān)聯(lián)

關(guān)聯(lián)分析是指如果兩個(gè)或多個(gè)事物之間存在一定的關(guān)聯(lián)葡盗,那么其中一個(gè)事物就能通過(guò)其他事物進(jìn)行預(yù)測(cè),其目的是為了挖掘隱藏在數(shù)據(jù)間的相互關(guān)系啡浊。

在數(shù)據(jù)挖掘的基本任務(wù)中觅够,關(guān)聯(lián)(Association)和順序序貫?zāi)P停⊿equencing)的關(guān)聯(lián)分析是指搜索事務(wù)數(shù)據(jù)庫(kù)(Transactional Databases)中的所有細(xì)節(jié)或事務(wù),從中尋找重復(fù)出現(xiàn)概率很高的模式或規(guī)則虫啥。

關(guān)聯(lián)分析是尋找同一事件中出現(xiàn)的不同項(xiàng)的相關(guān)性蔚约,比如,一次購(gòu)買(mǎi)活動(dòng)中所買(mǎi)不同商品的相關(guān)性涂籽,利用這些關(guān)聯(lián)規(guī)則可以了解用戶(hù)的行為,這對(duì)于改進(jìn)電商商務(wù)活動(dòng)的決策很有幫助砸抛,比如评雌,可以幫助改進(jìn)商品的擺放等。

3 決策樹(shù)

決策樹(shù)(Decision Trees)主要是指分類(lèi)和回歸樹(shù)(Classification andRegression Trees直焙,CART)景东。它是運(yùn)用最廣泛的數(shù)據(jù)挖掘算法,其中分類(lèi)樹(shù)(Classification Tree)主要用于數(shù)據(jù)記錄的標(biāo)記和歸類(lèi)奔誓;回歸樹(shù)(RegressionTree)主要用于估計(jì)目標(biāo)變量的數(shù)值斤吐。決策樹(shù)的最大優(yōu)點(diǎn)在于它的易于理解搔涝,缺點(diǎn)是難于處理關(guān)系復(fù)雜的數(shù)據(jù)。決策樹(shù)是一種常用于預(yù)測(cè)模型的算法和措,預(yù)測(cè)技術(shù)乃依據(jù)某一特定對(duì)象屬性庄呈,觀察其過(guò)去的行為或歷史資料,推算其未來(lái)的值會(huì)是多少派阱。決策樹(shù)是同時(shí)提供分類(lèi)和預(yù)測(cè)常用的方法诬留。

4 神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)(Neural Networks)是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型贫母。這種網(wǎng)絡(luò)依靠系統(tǒng)的復(fù)雜程度文兑,通過(guò)調(diào)整內(nèi)部大量節(jié)點(diǎn)之間相互連接的關(guān)系,從而達(dá)到處理信息的目的腺劣。神經(jīng)網(wǎng)絡(luò)廣泛地應(yīng)用于預(yù)測(cè)模型的建立绿贞,與決策樹(shù)一樣,它是目前數(shù)據(jù)挖掘中運(yùn)用最多的算法之一橘原。神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)在于對(duì)復(fù)雜問(wèn)題的預(yù)測(cè)籍铁,但它不能解釋預(yù)測(cè)結(jié)果。因此靠柑,當(dāng)對(duì)規(guī)則的解釋是問(wèn)題的關(guān)鍵時(shí)寨辩,神經(jīng)網(wǎng)絡(luò)并不是一個(gè)好的選擇。此外歼冰,當(dāng)輸入變量過(guò)多(成百上千)時(shí)靡狞,神經(jīng)網(wǎng)絡(luò)難以得到滿(mǎn)意的結(jié)果,這時(shí)隔嫡,通常采取神經(jīng)網(wǎng)絡(luò)和決策樹(shù)結(jié)合的方法甸怕。

神經(jīng)網(wǎng)絡(luò)常用于解決根據(jù)客戶(hù)信息,預(yù)測(cè)客戶(hù)流失的可能性腮恩,以及如何從眾多申請(qǐng)經(jīng)費(fèi)或者納稅中發(fā)現(xiàn)欺詐等問(wèn)題梢杭。

5 回歸

回歸分析的主要內(nèi)容為從一組數(shù)據(jù)出發(fā)確定某些變量之間的定量關(guān)系式,即建立數(shù)學(xué)模型并估計(jì)其中的未知參數(shù)秸滴。估計(jì)參數(shù)的常用方法是最小二乘法武契;對(duì)這些關(guān)系式的可信程度進(jìn)行檢驗(yàn);在許多自變量共同影響著一個(gè)因變量的關(guān)系中荡含,判斷哪個(gè)(或哪些)自變量的影響是顯著的咒唆,哪些自變量的影響是不顯著的,將影響顯著的自變量選入模型中释液,而剔除影響不顯著的變量全释,通常用逐步回歸、向前回歸和向后回歸等方法误债;利用所求的關(guān)系式對(duì)某一生產(chǎn)過(guò)程進(jìn)行預(yù)測(cè)或控制浸船⊥ǎ回歸分析的應(yīng)用是非常廣泛的,利用統(tǒng)計(jì)軟件包可使各種回歸方法的計(jì)算十分方便李命。

回歸常用于自變量與因變量的影響關(guān)系登淘,如使用回歸分析可以解決產(chǎn)品質(zhì)量如何影響用戶(hù)滿(mǎn)意度的問(wèn)題。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末项戴,一起剝皮案震驚了整個(gè)濱河市形帮,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌周叮,老刑警劉巖辩撑,帶你破解...
    沈念sama閱讀 218,546評(píng)論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異仿耽,居然都是意外死亡合冀,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,224評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)项贺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)君躺,“玉大人,你說(shuō)我怎么就攤上這事开缎∽亟校” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,911評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵奕删,是天一觀的道長(zhǎng)俺泣。 經(jīng)常有香客問(wèn)我,道長(zhǎng)完残,這世上最難降的妖魔是什么伏钠? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,737評(píng)論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮谨设,結(jié)果婚禮上熟掂,老公的妹妹穿的比我還像新娘。我一直安慰自己扎拣,他們只是感情好赴肚,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,753評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著二蓝,像睡著了一般尊蚁。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上侣夷,一...
    開(kāi)封第一講書(shū)人閱讀 51,598評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音仑乌,去河邊找鬼百拓。 笑死琴锭,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的衙传。 我是一名探鬼主播决帖,決...
    沈念sama閱讀 40,338評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼蓖捶!你這毒婦竟也來(lái)了地回?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,249評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤俊鱼,失蹤者是張志新(化名)和其女友劉穎刻像,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體并闲,經(jīng)...
    沈念sama閱讀 45,696評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡细睡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,888評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了帝火。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片溜徙。...
    茶點(diǎn)故事閱讀 40,013評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖犀填,靈堂內(nèi)的尸體忽然破棺而出蠢壹,到底是詐尸還是另有隱情,我是刑警寧澤九巡,帶...
    沈念sama閱讀 35,731評(píng)論 5 346
  • 正文 年R本政府宣布图贸,位于F島的核電站,受9級(jí)特大地震影響比庄,放射性物質(zhì)發(fā)生泄漏求妹。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,348評(píng)論 3 330
  • 文/蒙蒙 一佳窑、第九天 我趴在偏房一處隱蔽的房頂上張望制恍。 院中可真熱鬧,春花似錦神凑、人聲如沸净神。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,929評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)鹃唯。三九已至,卻和暖如春瓣喊,著一層夾襖步出監(jiān)牢的瞬間坡慌,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,048評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工藻三, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留洪橘,地道東北人跪者。 一個(gè)月前我還...
    沈念sama閱讀 48,203評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像熄求,于是被迫代替她去往敵國(guó)和親渣玲。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,960評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容