Union-Find algorithm-并查集算法

并查集

并查集(Union-Find Set)省店,也稱為不相交集數據結構(Disjointed Set Data Structure)。是指一系不相交的集合(Sets),提供合并(Union)和查找(Find)兩種操作。

  • find(I)
    find(i)即查找I所歸屬的集合山涡,通常我們使用find(i)和find(j)判斷i和j是否連通,即是否屬于同一個集合
  • union(int i , int j)
    顧名思義,union方法即將I和J所在的兩個集合連通起來鸭丛,執(zhí)行這個方法后霍殴,I所在集合和所有元素和J所在集合的所有元素都連通

適用場景

Union-Find算法最常見的使用場景就是動態(tài)連通(dynamic-connectivity)了


Is there a path connecting p and q?

我們在浩如煙海的數據中要判斷兩個元素是否連通,是很有實際意義的系吩。比如計算機網絡中兩臺不同計算機是否連通,社交網絡中兩個人是否有聯系妒蔚,一張圖片中兩個像素之間的聯系等穿挨。

Quick Find

我們首先來看一下第一種實現方案。數據結構我們用數據來實現肴盏,假設一個集合有N個元素科盛,我們用一個長度為N的數組來存儲。array[0]...array[N-1]菜皂。相同集合內的元素贞绵,array中的元素相等。

quick find
public class QuickFindUF
{
   private int[] id;
  public QuickFindUF(int N){
      id = new int[N];
      for(int j = 0 ; j < N ; j ++){        //N array accesses
          id[j] = j;
      }
  }

  public boolean connected(int p , int q){
        return id[p] == id[q];              //2 array accesses
  }

  public void union(int p , int q){        //at most 2N + 2 array accesses
        int pid = id[p];
        int qid = id[q];
        for(int i = 0 ; i < id.length ; i ++){
            if(id[i] == pid) id[i] = qid;
        }
  }
}
quick find時間復雜度

我們看到恍飘,quick-find算法find是很快的榨崩,時間復雜度只有1, 但是union操作相當耗時,quick-find算法的時間度是N的平方章母。這就意味著母蛛,當處理大量數據時,耗時指數上升乳怎。換個說法彩郊,假設計算機能力提高十位,而我們的數據量擴大十倍蚪缀,我們的速度反而降低了十倍秫逝。

Quick-Union

我們再來看一下另一種實現-Quick-Union算法。數據結構我們保持不變询枚,依然是一個數組违帆,但數據中的元素不再是"groupId"。我們邏輯上把這個數據想象成一棵樹哩盲,而數據中的元素存放的是父節(jié)點前方。

quick-union

這種情況下,假設我們要計算union(p , q)廉油,只需要將p所在樹的根節(jié)點設置成q所在樹的根節(jié)點即可惠险,話不多說,上圖抒线。

union操作(quick-union)

quick-union顧名思義班巩,是快速union的算法,與quick-find相比,不需要遍歷數組抱慌,將所有集合中元素都修改為新的"groupId"逊桦。而只需要將兩個集合的根節(jié)點連接到一起即可。我們看下代碼:

public class QuickUnionUf{

    private int[] id;
    public QuickUnionUf(int N){
          id = new int[N];
          for(int j = 0 ; j < N ; j ++){        //N array accesses
              id[j] = j;
          }
    }

    private int root(int p){                  //depth of p array accesses
        while(id[p] != p){
            p = id[p];
        }
        return p;
    }

    public boolean connected(int p , int q){        
        return root(id[p]) == root(id[q]);          //depth of p and q array accesses
    }

    public void union(int p , int q){              //depth of p and q array accesses
          int i = root(p);
          int j = root(q);
          id[I] = j;
    }
}
時間復雜度

weighted-quickUnion

以上兩種算法復度度都不夠好抑进,我們再看下如何改進强经。quick-union我們已經分析過了,相比于quick-find寺渗,通過樹的根節(jié)點的改變匿情,減少了union的時間復雜度。但是在極端情況下信殊,樹可能會出現不平衡的狀況炬称,最壞情況時間復雜度為N。我們的思路是要盡量使樹平衡涡拘,因為平衡樹深搜的復雜度是lgN玲躯,所以我們優(yōu)化了quick-union。

public class weightedQuickUnionUF{
    private int[] id;
    private int[] sz;
    private int count;
    public WeightedQuickUnionUF(int N){
        count = N;
        id = new int[N];
        for(int i=0; i<N; i++)  id[i] = I;
        sz = new int[N];
        for(int i=0; i<N; i++)   id[i] = 1;
    }
    public int count(){
        return count;
    }
    public boolean connected(int p, int q){
        return find(p) == find(q);
    }
    private int root(int p){
        while( p != id[p]) p = id[p];
        return p;
    }
    public void union(int p, int q){
        int i = root(p);
        int j = root(q);
        if( i == j)  return;
        //判斷兩棵樹大小鳄乏,將小樹掛在大樹上
        if( sz[i] < sz[j]) { id[i] = j; sz[j] += sz[I];}
        else   { id[j] = i; sz[i] += sz[j]; }
        count--;
    }
}
時間復雜度

path-compression

這樣就結束了嗎跷车?還有沒有什么優(yōu)化的點?隨著數據的增加橱野,樹的深度不斷增加姓赤,性能會逐漸變差。這個時候仲吏,如果我們在計算一個node的root時不铆,將node為根的樹摘下來,掛在當前樹的根結點上裹唆,會降低樹的深度誓斥,也就是提高效率,降低時間復雜度许帐。這種方法叫路徑壓縮:path-compression劳坑。

要做這個修改其實很簡單,我們只需要修改一下root方法成畦,就可以了距芬。

private int root(int p){
        while( p != id[p]) {
            id[p] = id[id[p]];       //加了這一句,當循環(huán)結束后循帐,就會把p為根結點的樹摘下來框仔,掛在所在樹的根結點上
            p = id[p];
        }
        return p;
    }
時間復雜度
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市拄养,隨后出現的幾起案子离斩,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,682評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件跛梗,死亡現場離奇詭異寻馏,居然都是意外死亡,警方通過查閱死者的電腦和手機核偿,發(fā)現死者居然都...
    沈念sama閱讀 93,277評論 3 395
  • 文/潘曉璐 我一進店門诚欠,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人漾岳,你說我怎么就攤上這事聂薪。” “怎么了蝗羊?”我有些...
    開封第一講書人閱讀 165,083評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長仁锯。 經常有香客問我耀找,道長,這世上最難降的妖魔是什么业崖? 我笑而不...
    開封第一講書人閱讀 58,763評論 1 295
  • 正文 為了忘掉前任野芒,我火速辦了婚禮,結果婚禮上双炕,老公的妹妹穿的比我還像新娘狞悲。我一直安慰自己,他們只是感情好妇斤,可當我...
    茶點故事閱讀 67,785評論 6 392
  • 文/花漫 我一把揭開白布摇锋。 她就那樣靜靜地躺著,像睡著了一般站超。 火紅的嫁衣襯著肌膚如雪荸恕。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,624評論 1 305
  • 那天死相,我揣著相機與錄音融求,去河邊找鬼。 笑死算撮,一個胖子當著我的面吹牛生宛,可吹牛的內容都是我干的。 我是一名探鬼主播肮柜,決...
    沈念sama閱讀 40,358評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼陷舅,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了审洞?” 一聲冷哼從身側響起蔑赘,我...
    開封第一講書人閱讀 39,261評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后缩赛,有當地人在樹林里發(fā)現了一具尸體耙箍,經...
    沈念sama閱讀 45,722評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年酥馍,在試婚紗的時候發(fā)現自己被綠了辩昆。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,030評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡旨袒,死狀恐怖汁针,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情砚尽,我是刑警寧澤施无,帶...
    沈念sama閱讀 35,737評論 5 346
  • 正文 年R本政府宣布攻走,位于F島的核電站奥帘,受9級特大地震影響,放射性物質發(fā)生泄漏蚜印。R本人自食惡果不足惜敷搪,卻給世界環(huán)境...
    茶點故事閱讀 41,360評論 3 330
  • 文/蒙蒙 一兴想、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧赡勘,春花似錦嫂便、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,941評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至践樱,卻和暖如春蔚龙,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背映胁。 一陣腳步聲響...
    開封第一講書人閱讀 33,057評論 1 270
  • 我被黑心中介騙來泰國打工木羹, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人解孙。 一個月前我還...
    沈念sama閱讀 48,237評論 3 371
  • 正文 我出身青樓坑填,卻偏偏與公主長得像,于是被迫代替她去往敵國和親弛姜。 傳聞我的和親對象是個殘疾皇子脐瑰,可洞房花燭夜當晚...
    茶點故事閱讀 44,976評論 2 355

推薦閱讀更多精彩內容