很久之前,寫過粗糙集方面的東西吏口,然鵝鴿了......最近開始更特征選擇了,因此粗糙集又重新開始更了!
粗糙集方面很久沒更了产徊,上一篇還是去年七月下旬昂勒,之后很久沒更這塊了,博客也很長(zhǎng)時(shí)間沒更新舟铜。最近在更特征選擇戈盈,恰好最近一位讀者私信我還會(huì)寫粗糙集這塊嗎,當(dāng)然會(huì)的啦谆刨。
閑話少說塘娶,開始吧!
本文與之前的博客一脈相承痊夭。
上近似和下近似
以之前病人病歷為例刁岸,這里我們使用體溫這個(gè)屬性。
病人 | 體溫 |
---|---|
正常 | |
高 | |
很高 | |
正常 | |
高 | |
很高 |
在這個(gè)信息系統(tǒng)中 她我,其中
為論域虹曙,
,
是體溫這個(gè)屬性鸦难。
那么根吁,
可以看出體溫這個(gè)屬性被劃分成了三類,很高合蔽,高和正常击敌。
若給定一個(gè)集合,
拴事,顯然
是
的粗糙集沃斤,因?yàn)?img class="math-inline" src="https://math.jianshu.com/math?formula=X" alt="X" mathimg="1">不能被
中的任何一個(gè)或者若干個(gè)組合構(gòu)成。
先看上近似刃宵。
在中衡瓶,
此時(shí),稱和
為
關(guān)于
的上近似牲证。
再看下近似哮针。
在中,
而
此時(shí)坦袍,稱為
關(guān)于
的下近似十厢。
給出上下近似的定義:
在一個(gè)決策信息系統(tǒng)中中,
是一個(gè)等價(jià)關(guān)系捂齐,
蛮放,
關(guān)于
的上近似和下近似的定義分別如下:
表示是由等價(jià)關(guān)系
形成的等價(jià)類,在往期的博客中有相關(guān)介紹奠宜,傳送門包颁。
關(guān)于上近似和下近似的一些解釋瞻想。
- 上近似則是將那些包含
的知識(shí)庫(kù)中的集合求并得到的(包含
的最小可定義集)
- 下近似是在那些所有的包含于
的知識(shí)庫(kù)中的集合中求并得到的(包含在
內(nèi)的最大可定義集)
或者說
- 上近似是根據(jù)現(xiàn)有知識(shí)
,判斷
中一定屬于和可能屬于
的對(duì)象所組成的集合娩嚼。
- 根據(jù)現(xiàn)有知識(shí)
蘑险,判斷
中所有肯定屬于
的對(duì)象所組成的集合,即式中待锈,表示等價(jià)關(guān)系
下包含關(guān)系
的等價(jià)類漠其。
正域嘴高,負(fù)域與邊界域
緊接著上下近似的概念竿音,正域,負(fù)域與邊界域的定義如下:
論域被
的上下近似集劃分為正域
拴驮,負(fù)域
以及邊界域
三個(gè)互不相交的區(qū)域春瞬。
正域:
負(fù)域:
邊界域:
可以發(fā)現(xiàn):
我們還是以上面體溫屬性為例。
關(guān)于
的上近似為
套啤,
宽气,下近似為
,所以
論域被
的上下近似集劃分為正域?yàn)椋?br>
負(fù)域?yàn)椋?br>
邊界域:
用一張圖來(lái)表示這個(gè)過程:
圖中藍(lán)色曲線為上近似潜沦。
實(shí)例
下表是一個(gè)決策信息系統(tǒng)萄涯。
1 | 0 | 1 | 1 | 1 | 0 | 1 |
2 | 1 | 1 | 0 | 1 | 0 | 1 |
3 | 1 | 0 | 0 | 0 | 1 | 0 |
4 | 1 | 1 | 0 | 1 | 0 | 1 |
5 | 1 | 0 | 0 | 0 | 1 | 0 |
6 | 0 | 1 | 1 | 1 | 1 | 0 |
7 | 0 | 1 | 1 | 1 | 1 | 0 |
8 | 1 | 0 | 0 | 1 | 0 | 1 |
9 | 1 | 0 | 0 | 1 | 0 | 0 |
其中論域,條件屬性集
唆鸡,決策屬性集
涝影。
從上表中有:,
争占,
燃逻。
每個(gè)屬性的值域都為。
注意臂痕,是條件屬性伯襟,未包括決策屬性
。
假設(shè):握童。
則:
上近似:
下近似:
正域?yàn)椋?br>
負(fù)域?yàn)椋?br>
邊界域:
本文內(nèi)容暫告一段落姆怪,之后將繼續(xù)更新。
本文參考了:
- 景運(yùn)革. 基于知識(shí)粒度的動(dòng)態(tài)屬性約簡(jiǎn)算法研究[D].西南交通大學(xué),2017.
- 苗奪謙澡绩,李國(guó)道《粗糙集理論稽揭,算法和應(yīng)用》.
- 張文修《基于粗糙集的不確定決策》.