bfprt算法

前言

在一個(gè)數(shù)組中求其第k大或者第k小的數(shù)的問(wèn)題(其實(shí)就是找按降序或升序排好序的數(shù)組的下標(biāo)為k-1的元素)呜魄,簡(jiǎn)稱TOP-K問(wèn)題。解決TOP-K問(wèn)題最有效的算法是bfprt算法构韵,又稱中位數(shù)的中位數(shù)算法周蹭,該算法由Blum、Floyd疲恢、Pratt凶朗、Rivest、Tarjan提出冈闭。
類似題目 215. 數(shù)組中的第K個(gè)最大元素

bfprt算法

  • TOP-K問(wèn)題其實(shí)可以使用快排的partition來(lái)求解俱尼,通常選擇開(kāi)頭、末尾或隨機(jī)選擇一個(gè)數(shù)作為軸來(lái)劃分?jǐn)?shù)據(jù)萎攒,但這存在一個(gè)問(wèn)題就是最差情況下遇八,算法時(shí)間復(fù)雜度會(huì)退化為O(n^2)
  • 而bfprt算法就是基于partition的基礎(chǔ)上做出優(yōu)化耍休,旨在選擇一個(gè)合適的樞軸刃永,使得算法的最壞時(shí)間復(fù)雜度為O(n)

bfprt算法的步驟:

  • 選擇樞軸
  • partition羊精,劃分?jǐn)?shù)據(jù)
  • 根據(jù)partition的結(jié)果斯够,遞歸

樞軸的選擇

  • 首先將給定數(shù)組劃分為 n / 5組,每組 5個(gè)元素喧锦,若有多出不足5個(gè)的读规,自成一組
  • 使用插入排序找到每個(gè)組的中位數(shù),組成中位數(shù)數(shù)組medians
  • 找到中位數(shù)數(shù)組medians中的中位數(shù)燃少,以此作為樞軸去partition
    //排序束亏,然后返回中位數(shù)
    private int getMedian(int[] nums, int begin, int end){
        for(int i = begin + 1;i <= end;i++){
            for(int j = i;j > begin && nums[j] < nums[j - 1]; j--){
                swap(nums, j ,j - 1);
            }
        }
        return nums[begin + ((end - begin) >> 1)];
    }
    private int getMedianOfMedians(int[] nums, int begin, int end){
        int num = end - begin + 1;
        int offset = num % 5 == 0 ? 0 : 1;
        int[] medians = new int[num / 5 + offset];
        for(int i = 0; i < medians.length;i++){
            int subBegin = begin + i * 5;
            int subEnd = subBegin + 4;
            medians[i] = getMedian(nums, subBegin, Math.min(subEnd, end));
        }
        //調(diào)用bfprt方法找到medians的中位數(shù)
        return bfprt(medians, 0, medians.length - 1, medians.length / 2);
    } 

partition

  • partition是以某個(gè)元素(假設(shè)為pivot)為樞軸去劃分?jǐn)?shù)組,有兩種劃分方式(以從小到大為例):

一輪partition結(jié)束后阵具,pivot就確定了它在數(shù)組中的位置碍遍。

private int[] partition(int[] nums, int begin, int end, int pivot){
        int l = begin - 1, r = end + 1;
        int i = begin;
        while(i < r){
            if(nums[i] == pivot){
                i++;
            }else if(nums[i] > pivot){
                swap(nums, ++l, i++);
            }else{
                swap(nums, i, --r);
            }
        }
        return new int[]{l + 1, r - 1};
    }

bfprt求解

bfprt算法采用分治的思想,首先找到樞軸阳液,再partition怕敬,以荷蘭國(guó)旗問(wèn)題的partition為例,它返回中間部分的劃分點(diǎn)[l, r]帘皿,如下圖


因?yàn)橄聵?biāo)4 -> 6這部分元素的最終位置已經(jīng)確定东跪,所以我們只需要判斷k是否落在這個(gè)區(qū)間,如果是則返回nums[k]鹰溜;如果k < l越庇,說(shuō)明k在左邊部分,則在l的左邊部分繼續(xù)找奉狈;如果k > r卤唉,說(shuō)明k在右邊部分,則在r的右邊部分繼續(xù)找仁期。

private int bfprt(int[] nums, int begin, int end, int k){
        if(begin == end) return nums[begin];
        int pivot = getMedianOfMedians(nums, begin, end);
        int[] partition = partition(nums, begin, end, pivot);
        if(k >= partition[0] && k <= partition[1]){
            return nums[k];
        }else if(k > partition[1]){
            return bfprt(nums, partition[1] + 1, end, k);
        }else{
            return bfprt(nums, begin, partition[0] - 1, k);
        }
    }

時(shí)間復(fù)雜度

  • 每個(gè)組的5個(gè)元素排序時(shí)間復(fù)雜度為O(1)桑驱,n / 5組一共就是O(n)
  • 取出中位數(shù)組成中位數(shù)數(shù)組O(n)
  • 找到中位數(shù)數(shù)組中的中位數(shù)T(n / 5)
  • 左右劃分后,會(huì)折掉一部分?jǐn)?shù)據(jù)跛蛋,最壞情況是T(7n / 10)

    medians數(shù)組的大小為n / 5熬的,那么medians數(shù)組中有n / 10個(gè)數(shù)比中位數(shù)pivot小,而這n / 10個(gè)數(shù)在自己的組內(nèi)又有兩個(gè)數(shù)比它小赊级,所以至少有3n / 10個(gè)數(shù)比pivot小押框,所以最多有7n / 10個(gè)數(shù)比pivot大。

最后T(n) = T(7n / 10) + T(n / 5) + O(n)理逊,得到時(shí)間復(fù)雜度為O(n)

總結(jié)

  • 隨機(jī)選擇樞軸時(shí)橡伞,會(huì)導(dǎo)致一個(gè)不好的情況是partition之后盒揉,折掉的數(shù)據(jù)很少,剩下一部分?jǐn)?shù)據(jù)繼續(xù)遞歸兑徘;bfprt通過(guò)修改選擇樞軸的策略刚盈,保證每次partition< pivot部分和> pivot部分的元素?cái)?shù)量差不多,這樣每次就可以折掉很多數(shù)據(jù)挂脑。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末藕漱,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子崭闲,更是在濱河造成了極大的恐慌肋联,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,406評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件刁俭,死亡現(xiàn)場(chǎng)離奇詭異橄仍,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)薄翅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,732評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門沙兰,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人翘魄,你說(shuō)我怎么就攤上這事鼎天。” “怎么了暑竟?”我有些...
    開(kāi)封第一講書人閱讀 163,711評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵斋射,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我但荤,道長(zhǎng)罗岖,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書人閱讀 58,380評(píng)論 1 293
  • 正文 為了忘掉前任腹躁,我火速辦了婚禮桑包,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘纺非。我一直安慰自己哑了,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,432評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布烧颖。 她就那樣靜靜地躺著弱左,像睡著了一般。 火紅的嫁衣襯著肌膚如雪炕淮。 梳的紋絲不亂的頭發(fā)上拆火,一...
    開(kāi)封第一講書人閱讀 51,301評(píng)論 1 301
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼们镜。 笑死币叹,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的憎账。 我是一名探鬼主播套硼,決...
    沈念sama閱讀 40,145評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼卡辰,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼胞皱!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起九妈,我...
    開(kāi)封第一講書人閱讀 39,008評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤反砌,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后萌朱,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體宴树,經(jīng)...
    沈念sama閱讀 45,443評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,649評(píng)論 3 334
  • 正文 我和宋清朗相戀三年晶疼,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了酒贬。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,795評(píng)論 1 347
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡翠霍,死狀恐怖锭吨,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情寒匙,我是刑警寧澤零如,帶...
    沈念sama閱讀 35,501評(píng)論 5 345
  • 正文 年R本政府宣布,位于F島的核電站锄弱,受9級(jí)特大地震影響考蕾,放射性物質(zhì)發(fā)生泄漏会宪。R本人自食惡果不足惜肖卧,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,119評(píng)論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望掸鹅。 院中可真熱鬧塞帐,春花似錦、人聲如沸河劝。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,731評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春牡辽,著一層夾襖步出監(jiān)牢的瞬間喳篇,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,865評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工态辛, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留麸澜,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,899評(píng)論 2 370
  • 正文 我出身青樓奏黑,卻偏偏與公主長(zhǎng)得像炊邦,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子熟史,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,724評(píng)論 2 354