存在的問題:當各個聚類中心的密度的差異較大呻此,或者同一個類中包含多個密度中心時碌补,DPC計
算效果受到影響?
主流改進的點dpc:在聚類中心的判斷桶癣,截斷距離dc 的選擇,密度計算方法的修改
基于二分法的改進:算法主要分為四個部分
算法1
1.利用KNN求dc(dc自己規(guī)定的公式娘锁。)
?2.計算高低密度的分界值牙寞。
3.調(diào)用算法2,對高密度點進行密度中心計算
4.調(diào)用算法3莫秆,實現(xiàn)聚類中心合并
5.調(diào)用算法4间雀,實現(xiàn)數(shù)據(jù)點的分配尤慰。
算法2
1.重新計算高密度點的ρi。
2計算δi
3.計算聚類中心點雷蹂。
算法3
1.計算聚類中心點兩兩之間是否dc可達。
2.如果兩個點之間dc可達杯道,把兩者中密度較小點從集合C中刪除匪煌。
算法4
1. 對于高密度點使用與原密度峰值聚類方法算法同樣的策略。
2. 對于低密度點做如下操作
????????2.1 首先通過以下公式定義點 i 和 j 之間的相似度wij 党巾。
? ? ? ? 2.2 定義類歸屬的概率萎庭,點 i 到點 c 的概率 pc i 。
????????2.3 對 pc i 進行排序升序排序齿拂,點 i 歸屬到比它大一些的那個點j