(1)監(jiān)督學習和無監(jiān)督學習的區(qū)別
總結(jié):監(jiān)督學習會對數(shù)據(jù)的輸入有確定的輸出,如腫瘤是良性的,或者腫瘤是惡性的;而無監(jiān)督學習只知道數(shù)據(jù)的輸出,通常數(shù)據(jù)的輸出是不知道的,如所有數(shù)據(jù)只知道它們都是腫瘤,而具體的良性或惡性的卻不知道.
(2)聚類分析
例子1:Google新聞會對描述同一事件的新聞進行聚類整理.當你點開一個標題塊時,會發(fā)現(xiàn)塊內(nèi)的三個不同URL指向三家不同媒體對同一事件的報道.
例子2:假設(shè)目前擁有大量的用戶數(shù)據(jù),但我們并不知道每個用戶屬于哪個細分市場,同時我們也不知道有哪些細分市場,此時就需要聚類算法來幫助我們把不同的用戶分為不同的細分市場,針對每個細分市場制定銷售策略.
總結(jié):聚類分析就是把一些看起來相同的數(shù)據(jù)根據(jù)某些特性(如內(nèi)容相關(guān)度)劃分成不同的類.