模糊C均值聚類算法(FCM)

【嵌牛導(dǎo)讀】FCM算法是一種基于劃分的聚類算法,它的思想就是使得被劃分到同一簇的對象之間相似度最大擅威,而不同簇之間的相似度最小盆驹。模糊C均值算法是普通C均值算法的改進(jìn),普通C均值算法對于數(shù)據(jù)的劃分是硬性的居凶,而FCM則是一種柔性的模糊劃分虫给。

【嵌牛提問】FCM有什么用?

【嵌牛鼻子】模糊C均值聚類算法

【嵌牛正文】

聚類分析是多元統(tǒng)計(jì)分析的一種侠碧,也是無監(jiān)督模式識(shí)別的一個(gè)重要分支抹估,在模式分類、圖像處理和模糊規(guī)則處理等眾多領(lǐng)域中獲得最廣泛的應(yīng)用弄兜。它把一個(gè)沒有類別標(biāo)記的樣本按照某種準(zhǔn)則劃分為若干子集药蜻,使相似的樣本盡可能歸于一類瓷式,而把不相似的樣本劃分到不同的類中。硬聚類把每個(gè)待識(shí)別的對象嚴(yán)格的劃分某類中语泽,具有非此即彼的性質(zhì)贸典,而模糊聚類建立了樣本對類別的不確定描述,更能客觀的反應(yīng)客觀世界踱卵,從而成為聚類分析的主流瓤漏。

模糊聚類算法是一種基于函數(shù)最優(yōu)方法的聚類算法莲趣,使用微積分計(jì)算技術(shù)求最優(yōu)代價(jià)函數(shù)擒抛,在基于概率算法的聚類方法中將使用概率密度函數(shù)随珠,為此要假定合適的模型,模糊聚類算法的向量可以同時(shí)屬于多個(gè)聚類班利,從而擺脫上述問題。 模糊聚類分析算法大致可分為三類:

1)分類數(shù)不定榨呆,根據(jù)不同要求對事物進(jìn)行動(dòng)態(tài)聚類罗标,此類方法是基于模糊等價(jià)矩陣聚類的,稱為模糊等價(jià)矩陣動(dòng)態(tài)聚類分析法积蜻。

2)分類數(shù)給定闯割,尋找出對事物的最佳分析方案,此類方法是基于目標(biāo)函數(shù)聚類的竿拆,稱為模糊C 均值聚類宙拉。

3)在攝動(dòng)有意義的情況下,根據(jù)模糊相似矩陣聚類丙笋,此類方法稱為基于攝動(dòng)的模糊聚類分析法谢澈。

我所學(xué)習(xí)的是模糊C 均值聚類算法,要學(xué)習(xí)模糊C 均值聚類算法要先了解慮屬度的含義御板,隸屬度函數(shù)是表示一個(gè)對象x 隸屬于集合A 的程度的函數(shù)锥忿,通常記做μA (x),其自變量范圍是所有可能屬于集合A 的對象(即集合A 所在空間中的所有點(diǎn))怠肋,取值范圍是[0,1]敬鬓,即0<=μA (x)<=1。μA (x)=1表示x 完全隸屬于集合A 笙各,相當(dāng)于傳統(tǒng)集合概念上的x ∈A 钉答。一個(gè)定義在空間X={x}上的隸屬度函數(shù)就定義了一個(gè)模糊集合A ,或者叫定義在論域X={x}上的模糊子集A 酪惭。對于有限個(gè)對象x 1希痴,x 2,……春感,x n 模糊集合A 可以表示為:A ={(μA (x i ), x i ) |x i ∈X } (6.1)

有了模糊集合的概念砌创,一個(gè)元素隸屬于模糊集合就不是硬性的了虏缸,在聚類的問題中,可以把聚類生成的簇看成模糊集合嫩实,因此刽辙,每個(gè)樣本點(diǎn)隸屬于簇的隸屬度就是[0,1]區(qū)間里面的值甲献。

FCM 算法需要兩個(gè)參數(shù)一個(gè)是聚類數(shù)目C 宰缤,另一個(gè)是參數(shù)m 。一般來講C 要遠(yuǎn)遠(yuǎn)小于聚類樣本的總個(gè)數(shù)晃洒,同時(shí)要保證C>1慨灭。對于m ,它是一個(gè)控制算法的柔性的參數(shù)球及,如果m 過大氧骤,則聚類效果會(huì)很次,而如果m 過小則算法會(huì)接近HCM 聚類算法吃引。算法的輸出是C 個(gè)聚類中心點(diǎn)向量和C*N的一個(gè)模糊劃分矩陣筹陵,這個(gè)矩陣表示的是每個(gè)樣本點(diǎn)屬于每個(gè)類的隸屬度。根據(jù)這個(gè)劃分矩陣按照模糊集合中的最大隸屬原則就能夠確定每個(gè)樣本點(diǎn)歸為哪個(gè)類镊尺。聚類中心表示的是每個(gè)類的平均特征朦佩,可以認(rèn)為是這個(gè)類的代表點(diǎn)。從算法的推導(dǎo)過程中我們不難看出庐氮,算法對于滿足正態(tài)分布的數(shù)據(jù)聚類效果會(huì)很好语稠。

通過實(shí)驗(yàn)和算法的研究學(xué)習(xí),不難發(fā)現(xiàn)FCM算法的優(yōu)缺點(diǎn):

首先旭愧,模糊c 均值泛函Jm 仍是傳統(tǒng)的硬c 均值泛函J1 的自然推廣颅筋。J1 是一個(gè)應(yīng)用很廣泛的聚類準(zhǔn)則,對其在理論上的研究已經(jīng)相當(dāng)?shù)耐晟剖淇荩@就為Jm 的研究提供了良好的條件议泵。

其次,從數(shù)學(xué)上看桃熄,Jm與Rs的希爾伯特空間結(jié)構(gòu)(正交投影和均方逼近理論) 有密切的關(guān)聯(lián)先口,因此Jm 比其他泛函有更深厚的數(shù)學(xué)基礎(chǔ)。

最后瞳收,F(xiàn)CM 聚類算法不僅在許多鄰域獲得了非常成功的應(yīng)用碉京,而且以該算法為基礎(chǔ),又提出基于其他原型的模糊聚類算法螟深,形成了一大批FCM類型的算法谐宙,比如模糊c線( FCL) ,模糊c面(FCP) 界弧,模糊c殼(FCS) 等聚類算法凡蜻,分別實(shí)現(xiàn)了對呈線狀搭综、超平面狀和“薄殼”狀結(jié)構(gòu)模式子集(或聚類) 的檢測。

模糊c均值算法因設(shè)計(jì)簡單划栓,解決問題范圍廣兑巾,易于應(yīng)用計(jì)算機(jī)實(shí)現(xiàn)等特點(diǎn)受到了越來越多人的關(guān)注,并應(yīng)用于各個(gè)領(lǐng)域忠荞。但是蒋歌,自身仍存在的諸多問題,例如強(qiáng)烈依賴初始化數(shù)據(jù)的好壞和容易陷入局部鞍點(diǎn)等委煤,仍然需要進(jìn)一步的研究堂油。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市碧绞,隨后出現(xiàn)的幾起案子称诗,更是在濱河造成了極大的恐慌,老刑警劉巖头遭,帶你破解...
    沈念sama閱讀 218,941評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異癣诱,居然都是意外死亡计维,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評論 3 395
  • 文/潘曉璐 我一進(jìn)店門撕予,熙熙樓的掌柜王于貴愁眉苦臉地迎上來鲫惶,“玉大人,你說我怎么就攤上這事实抡∏纺福” “怎么了?”我有些...
    開封第一講書人閱讀 165,345評論 0 356
  • 文/不壞的土叔 我叫張陵吆寨,是天一觀的道長赏淌。 經(jīng)常有香客問我,道長啄清,這世上最難降的妖魔是什么六水? 我笑而不...
    開封第一講書人閱讀 58,851評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮辣卒,結(jié)果婚禮上掷贾,老公的妹妹穿的比我還像新娘。我一直安慰自己荣茫,他們只是感情好想帅,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著啡莉,像睡著了一般港准。 火紅的嫁衣襯著肌膚如雪旨剥。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,688評論 1 305
  • 那天叉趣,我揣著相機(jī)與錄音泞边,去河邊找鬼。 笑死疗杉,一個(gè)胖子當(dāng)著我的面吹牛阵谚,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播烟具,決...
    沈念sama閱讀 40,414評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼梢什,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了朝聋?” 一聲冷哼從身側(cè)響起嗡午,我...
    開封第一講書人閱讀 39,319評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎冀痕,沒想到半個(gè)月后荔睹,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,775評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡言蛇,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年僻他,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片腊尚。...
    茶點(diǎn)故事閱讀 40,096評論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡吨拗,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出婿斥,到底是詐尸還是另有隱情劝篷,我是刑警寧澤,帶...
    沈念sama閱讀 35,789評論 5 346
  • 正文 年R本政府宣布民宿,位于F島的核電站娇妓,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏活鹰。R本人自食惡果不足惜峡蟋,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望华望。 院中可真熱鬧蕊蝗,春花似錦、人聲如沸赖舟。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽宾抓。三九已至子漩,卻和暖如春豫喧,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背幢泼。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評論 1 271
  • 我被黑心中介騙來泰國打工紧显, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人缕棵。 一個(gè)月前我還...
    沈念sama閱讀 48,308評論 3 372
  • 正文 我出身青樓孵班,卻偏偏與公主長得像,于是被迫代替她去往敵國和親招驴。 傳聞我的和親對象是個(gè)殘疾皇子篙程,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 1. 章節(jié)主要內(nèi)容 “聚類”(clustering)算法是“無監(jiān)督學(xué)習(xí)”算法中研究最多、應(yīng)用最廣的算法别厘,它試圖將數(shù)...
    閃電隨筆閱讀 5,042評論 1 24
  • 寫在之前 因簡書導(dǎo)入公式很麻煩虱饿,如果想獲得更好的觀看體驗(yàn)請移步https://www.zybuluo.com/ha...
    hainingwyx閱讀 6,839評論 2 13
  • 一些聚類算法 Birch層次聚類 ,KMeans原形算法 触趴,AGNES層次算法氮发, DBSCAN密度算法, LVQ原...
    AresAnt閱讀 2,589評論 0 2
  • 單選題 1. 某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn)冗懦,買啤酒的人很大概率也會(huì)購買尿布折柠,這種屬于數(shù)據(jù)挖掘的哪類問題?(A) A...
    山的那邊是什么_閱讀 33,559評論 2 59
  • 小編閑來無聊批狐,寫了一篇征文,放出來給大家看看前塔,希望得到大家的評價(jià)嚣艇,十分感謝。 遼寧陽光校園征文作品展示:作品展示0...
    夏筱白閱讀 200評論 1 3