本節(jié)我們將繼續(xù)介紹粗糙集有關(guān)的概念态罪。
上節(jié)我們介紹了知識粒度的矩陣表示形式,本節(jié)將介紹基于知識粒度屬性約簡定義和算法沥割。
基于粗糙特征選擇算法亦稱為屬性約簡耗啦,其旨在保持?jǐn)?shù)據(jù)集分類能力不變的前提下,通過約簡冗余屬性机杜,最后得到問題的決策或分類規(guī)則帜讲。
相關(guān)定義
設(shè)決策信息系統(tǒng),椒拗,如果為的最小屬性約簡舒帮,則:
第一個式子保證了約簡集有著與全體條件屬性集相同的劃分能力;而第二個條件保證了約簡集內(nèi)沒有冗余屬性陡叠。
近似分類精度的定義如下:
設(shè)決策信息系統(tǒng)玩郊,,是一個等價關(guān)系枉阵,則集合關(guān)于等價關(guān)系的近似分類精度為:
其粗糙度為:
近似分類質(zhì)量的定義如下:
設(shè)決策信息系統(tǒng)译红,,是一個等價關(guān)系兴溜,則集合關(guān)于等價關(guān)系的近似分類質(zhì)量為:
或者說
決策信息系統(tǒng)侦厚,,是論域的一個劃分拙徽,將的上近似和下近似分別定義為:
則的近似分類精度:
近似分類質(zhì)量:
特別地刨沦,若等價關(guān)系是被決策屬性集劃分的,膘怕,想诅,則的近似分類精度為:
近似分類質(zhì)量:
對于這種情況,我們先看一個例子,若
考慮論域對條件屬性集劃分的等價關(guān)系
下近似:
近似分類質(zhì)量:
再來看之前的一個例子:
是一個決策信息系統(tǒng)来破,考慮條件屬性對論域劃分的等價關(guān)系篮灼,,集合徘禁,顯然是一個粗糙集诅诱,則:
近似分類精度:
粗糙度:
近似分類質(zhì)量:
基于知識粒度的屬性約簡算法
在介紹完經(jīng)典粗糙集模型一些基本的相關(guān)概念后,我們將給出粗糙集里面的一個經(jīng)典算法送朱,基于知識粒度非動態(tài)屬性約簡算法娘荡。
算法:基于知識粒度的經(jīng)典啟發(fā)式屬性約簡算法
輸入:決策信息系統(tǒng)
輸出:論域上的約簡集
這就是基于知識粒度非動態(tài)屬性約簡算法的流程了,算法的流程雖然較多驶沼,但關(guān)鍵點在于等價類的劃分它改,這點解決后,它的實現(xiàn)就不難了商乎。
那么粗糙集有關(guān)的內(nèi)容就暫告一段落了央拖,系列博客介紹的也只是冰山一角,這里面還有很多很多的學(xué)問呢鹉戚,有興趣的可以查閱更多資料和文獻鲜戒。
本文參考了:
- 景運革. 基于知識粒度的動態(tài)屬性約簡算法研究[D].西南交通大學(xué),2017.