什么是粗糙集(六)

本節(jié)我們將繼續(xù)介紹粗糙集有關(guān)的概念态罪。



上節(jié)我們介紹了知識粒度的矩陣表示形式,本節(jié)將介紹基于知識粒度屬性約簡定義和算法沥割。

基于粗糙特征選擇算法亦稱為屬性約簡耗啦,其旨在保持?jǐn)?shù)據(jù)集分類能力不變的前提下,通過約簡冗余屬性机杜,最后得到問題的決策或分類規(guī)則帜讲。

相關(guān)定義

設(shè)決策信息系統(tǒng)S=(U,A=C \bigcup D,V,f)B \subseteq C椒拗,如果BS的最小屬性約簡舒帮,則:
GP_{U}(D \mid B)=GP_{U}(D\mid C)

\forall a \in B,\quad GP_{U}(D \mid B -\{a\})\not= GP_{U}(D \mid B)

第一個式子保證了約簡集B有著與全體條件屬性集C相同的劃分能力;而第二個條件保證了約簡集B內(nèi)沒有冗余屬性陡叠。

近似分類精度的定義如下:
設(shè)決策信息系統(tǒng)S=(U,A=C \bigcup D,V,f)玩郊,\forall X \subseteq UR是一個等價關(guān)系枉阵,則集合X關(guān)于等價關(guān)系R的近似分類精度為:
\alpha_{R}(X)=\frac{|\underline{R}X|}{|\overline{R}X|}

其粗糙度為:
\rho_{R}(X)=1-\alpha_{R}(X)

近似分類質(zhì)量的定義如下:
設(shè)決策信息系統(tǒng)S=(U,A=C \bigcup D,V,f)译红,\forall X \subseteq UR是一個等價關(guān)系兴溜,則集合X關(guān)于等價關(guān)系R的近似分類質(zhì)量為:
\gamma_{R}(X) =\frac{|\underline{R}X|}{|U|}
或者說
決策信息系統(tǒng)S=(U,A=C \bigcup D,V,f)侦厚,\forall X \subseteq UR=\{X_{1},X_{2},...,X_{m}\}是論域U的一個劃分拙徽,將R的上近似和下近似分別定義為:
\overline{R}X=\{\overline{R}X_{1},\overline{R}X_{2},...,\overline{R}X_{m} \}

\underline{R}X=\{\underline{R}X_{1},\underline{R}X_{2},...,\underline{R}X_{m} \}

R的近似分類精度:
\alpha_{R}(X)=\frac{\sum^{m}_{i=1}|\underline{R}X_{i}|}{\sum_{i=1}^{m}|\overline{R}X_{i} |}

近似分類質(zhì)量:
\gamma_{R}(X) =\frac{\sum_{i=1}^{m}|\underline{R}X_{i}|}{|U|}

特別地刨沦,若等價關(guān)系R是被決策屬性集D劃分的,U/D=\{X_{1},X_{2},...,X_{m} \}膘怕,\forall X \subseteq U想诅,則D的近似分類精度為:
\alpha_{R}(D)=\frac{POS_{R}(D)} {\sum_{i=1}^{m}|\overline{R}X_{i} |}

近似分類質(zhì)量:
\gamma_{R}(D) =\frac{POS_{R}(D)}{|U|}

對于這種情況,我們先看一個例子,若
U/D=\{X_1,X_2 \}=\{\{e_{1},X_1e_{4},e_{5},e_{8}\},\{e_2,e_3,e_6,e_7 \} \}

考慮論域U對條件屬性集C劃分的等價關(guān)系R
U/C=\{\{e_1\},\{e_2\},\{e_3\},\{e_4\},\{e_5,e_7\},\{e_6,e_8\} \}

下近似:
\underline{R}X_1=\{e_1,e_4\}

\underline{R}X_2=\{e_2,e_3\}

近似分類質(zhì)量:
\gamma_{R}(D)=\frac{|\underline{R}X_1|+|\underline{R}X_2|}{|U|}=\frac{4}{8}=\frac{1}{2}

再來看之前的一個例子
S=(U,A=C \bigcup D,V,f)是一個決策信息系統(tǒng)来破,考慮條件屬性C對論域U劃分的等價關(guān)系R篮灼,U/C=\{\{e_{3},e_{6} \},\{e_{2},e_{5} \},\{e_{1},e_{4} \} \},集合X=\{e_{1},e_{2},e_{4}\}徘禁,顯然X是一個粗糙集诅诱,則:
\underline{R}X=\{e_{1},e_{4}\} \quad \overline{R}X=\{e_{1},e_{2},e_{4},e_{5}\}

近似分類精度:
\alpha_{R}(X)=\frac{|\underline{R}X|}{|\overline{R}X|}=\frac{2}{4}=\frac{1}{2}

粗糙度:
\rho_{R}(X)=1-\alpha_{R}(X)=1-\frac{1}{2}=\frac{1}{2}

近似分類質(zhì)量:
\gamma_{R}(X) = \frac{|\underline{R}X|}{|U|} = \frac{2}{6} = \frac{1}{3}

基于知識粒度的屬性約簡算法

在介紹完經(jīng)典粗糙集模型一些基本的相關(guān)概念后,我們將給出粗糙集里面的一個經(jīng)典算法送朱,基于知識粒度非動態(tài)屬性約簡算法娘荡。


算法:基于知識粒度的經(jīng)典啟發(fā)式屬性約簡算法


輸入:決策信息系統(tǒng)S=(U,A=C \bigcup D,V,f)
輸出:論域U上的約簡集RED_{U}
begin

\quad RED_{U} \leftarrow \varnothing

\quad for \quad 1\leq j \leq |C| \quad do

\quad \quad Calculate \quad Sig_{U}^{inner}(a_{j},C,D);

\quad \quad \quad if \quad Sig_{U}^{inner}(a_{j},C,D)>0 \quad then

\quad \quad \quad \quad RED_{U} \leftarrow (RED_{U} \bigcup {a_{j}});

\quad \quad \quad end

\quad \quad end

\quad Let \quad B \leftarrow RED_{U};

\quad while \quad GP_{U}(D \mid B) \neq GP_{U}(D \mid C) \quad do

\quad \quad for \quad each \quad a_{i}\in (C-B) \quad do

\quad \quad \quad Calculate \quad Sig_{U}^{outer}(a_{i},B,D);

\quad \quad \quad a_{0}=max\{Sig_{U}^{outer}(a_{i},B,D),a_{i} \in (C-B)\};

\quad \quad \quad B\leftarrow (B \bigcup \{a_{0} \});

\quad \quad end

\quad end

\quad for \quad each \quad a_{i} \in B \quad do

\quad \quad if \quad GP_{U}(D \mid (B-\{a_{i} \}))=GP_{U}(D \mid C) \quad then

\quad \quad \quad B \leftarrow (B-\{a_{i}\});

\quad \quad end

\quad end

\quad RED_{U} \leftarrow B;

\quad return \quad reduction \quad RED_{U}

end


這就是基于知識粒度非動態(tài)屬性約簡算法的流程了,算法的流程雖然較多驶沼,但關(guān)鍵點在于等價類的劃分它改,這點解決后,它的實現(xiàn)就不難了商乎。

那么粗糙集有關(guān)的內(nèi)容就暫告一段落了央拖,系列博客介紹的也只是冰山一角,這里面還有很多很多的學(xué)問呢鹉戚,有興趣的可以查閱更多資料和文獻鲜戒。


本文參考了:

  • 景運革. 基于知識粒度的動態(tài)屬性約簡算法研究[D].西南交通大學(xué),2017.
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市抹凳,隨后出現(xiàn)的幾起案子遏餐,更是在濱河造成了極大的恐慌,老刑警劉巖赢底,帶你破解...
    沈念sama閱讀 217,657評論 6 505
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件失都,死亡現(xiàn)場離奇詭異,居然都是意外死亡幸冻,警方通過查閱死者的電腦和手機粹庞,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,889評論 3 394
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來洽损,“玉大人庞溜,你說我怎么就攤上這事”ǎ” “怎么了流码?”我有些...
    開封第一講書人閱讀 164,057評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長延刘。 經(jīng)常有香客問我漫试,道長,這世上最難降的妖魔是什么碘赖? 我笑而不...
    開封第一講書人閱讀 58,509評論 1 293
  • 正文 為了忘掉前任驾荣,我火速辦了婚禮外构,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘秘车。我一直安慰自己典勇,他們只是感情好劫哼,可當(dāng)我...
    茶點故事閱讀 67,562評論 6 392
  • 文/花漫 我一把揭開白布叮趴。 她就那樣靜靜地躺著,像睡著了一般权烧。 火紅的嫁衣襯著肌膚如雪眯亦。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,443評論 1 302
  • 那天般码,我揣著相機與錄音妻率,去河邊找鬼。 笑死板祝,一個胖子當(dāng)著我的面吹牛宫静,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播券时,決...
    沈念sama閱讀 40,251評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼孤里,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了橘洞?” 一聲冷哼從身側(cè)響起捌袜,我...
    開封第一講書人閱讀 39,129評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎炸枣,沒想到半個月后虏等,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,561評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡适肠,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,779評論 3 335
  • 正文 我和宋清朗相戀三年霍衫,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片侯养。...
    茶點故事閱讀 39,902評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡慕淡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出沸毁,到底是詐尸還是另有隱情峰髓,我是刑警寧澤,帶...
    沈念sama閱讀 35,621評論 5 345
  • 正文 年R本政府宣布息尺,位于F島的核電站携兵,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏搂誉。R本人自食惡果不足惜徐紧,卻給世界環(huán)境...
    茶點故事閱讀 41,220評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧并级,春花似錦拂檩、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,838評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至愈涩,卻和暖如春望抽,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背履婉。 一陣腳步聲響...
    開封第一講書人閱讀 32,971評論 1 269
  • 我被黑心中介騙來泰國打工煤篙, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人毁腿。 一個月前我還...
    沈念sama閱讀 48,025評論 2 370
  • 正文 我出身青樓辑奈,卻偏偏與公主長得像,于是被迫代替她去往敵國和親已烤。 傳聞我的和親對象是個殘疾皇子鸠窗,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,843評論 2 354