算法-位圖排序

0. Thanks

1. 概述

有這樣的一道題目教翩,給出一定范圍的1億個(gè)數(shù)據(jù)(N=<數(shù)據(jù)<=M)呛谜,要求給他從小到大排序
顯然這個(gè)涉及到超大數(shù)據(jù)的排序鳍徽。一般有兩個(gè)套路:一個(gè)用堆排序婶芭,一個(gè)是用位圖排序贪磺。這里說(shuō)
一下位圖排序赋朦。

2. 原理

位圖排序其實(shí)是用數(shù)據(jù)的下標(biāo)作映射到對(duì)應(yīng)的數(shù)據(jù)拧略。假如現(xiàn)在有一個(gè)待排序的數(shù)據(jù):
int[] a = {4,7,2,5,3};

我們需要先知道這些數(shù)據(jù)的取值范圍芦岂,我們看到數(shù)據(jù)是<8,那么我們初始化8個(gè)bit位的數(shù)組:


5.png

并把他們初始化為零辑鲤。每一個(gè)bit位的取值是0盔腔,或者1。
然后把每一個(gè)的待排序的數(shù)字取出來(lái)月褥,根據(jù)數(shù)字的大小把bit數(shù)組的對(duì)應(yīng)下標(biāo)的bit置為1.

6.png

到最后會(huì)變成這樣:

7.png

然后弛随,我們從第0未bit開(kāi)始打印非0位的下標(biāo),也就是:23457宁赤,也就排好序了舀透。

3. Java來(lái)實(shí)現(xiàn)一下

基本的數(shù)據(jù)類型是沒(méi)有bit,最小是byte决左,所以我們先實(shí)現(xiàn)一個(gè)bit數(shù)組這樣的一個(gè)數(shù)據(jù)結(jié)構(gòu):

/**
 * 這里愕够,先實(shí)現(xiàn)一個(gè)位數(shù)組的數(shù)據(jù)結(jié)構(gòu)
 */
public static class BitArr {
    private int bitLength = 0;
    private byte[] bytes;
    public byte[] getBytes() {
        return bytes;
    }
    /**
     * 構(gòu)建多少位的位數(shù)組
     * @param bitLength 位長(zhǎng)
     */
    public BitArr(int bitLength) {
        this.bitLength = bitLength;
        bytes = new byte[(int) Math.ceil((double) bitLength/7)];
    }
    /**
     * 標(biāo)記某一個(gè)位
     * 設(shè)置為1
     * @param position 位
     */
    public void mark(int position) {
        if (position>bitLength)
            return;
        int arrIndex = position/7;
        int bitIndex = position%7;
        bytes[arrIndex] |= (1 << (6-bitIndex));
    }
    public void cleanMark(int position) {
        if (position>bitLength)
            return;
        int arrIndex = position/7;
        int bitIndex = position%7;
        bytes[arrIndex] &= ~(1 << (6-bitIndex));
    }
    public void printAllBit() {
        for (byte aByte : bytes) {
            System.out.print(BitArr.Byte2String(aByte));
        }
        System.out.println();
    }
    /**
     * 打印除符號(hào)位的bit
     * @param nByte
     * @return
     */
    private static String Byte2String(byte nByte){
        StringBuilder nStr=new StringBuilder();
        for(int i=6;i>=0;i--) {
            int j=(int)nByte & (int)(Math.pow(2, (double)i));
            if(j>0){
                nStr.append("1");
            }else {
                nStr.append("0");
            }
        }
        return nStr.toString();
    }
}

再基于此實(shí)現(xiàn)算法:

public static int[] bitmapSort(int[] arr, int theMax) {
    if (arr==null || arr.length==0)
        return null;
    BitArr bitArr = new BitArr(theMax+1);
    for (int anArr : arr) {
        bitArr.mark(anArr);
    }
    int[] result = new int[arr.length];
    byte[] bytes = bitArr.getBytes();
    int index = 0;
    for (int i = 0; i < bytes.length; i++) {
        for (int j = 0; j < 7; j++) {
            byte temp = (byte) (1<<6-j);
            byte b = (byte) (bytes[i] & temp);
            if ( b == temp) {
                result[index++] = i*7 + j;
            }
        }
    }
    return result;
}

來(lái)個(gè)驗(yàn)證:

public static void main(String[] args) {
    int[] a = {4,7,2,5,14,3,8,12};
    int[] end = bitmapSort(a, 14);
    for (int x : end) {
        System.out.print(x+",");
    }
}
//輸出
2,3,4,5,7,8,12,14,

有幾個(gè)地方需要注意:

  • java里面沒(méi)有無(wú)符號(hào)的類型走贪,所以我們只能用byte的前7位

上面寫的Java實(shí)現(xiàn),其實(shí)還有幾個(gè)問(wèn)題:

  • 如果我們一開(kāi)始并不知道惑芭,這堆待排序數(shù)據(jù)的取值范圍怎么辦坠狡?也許可以采取動(dòng)態(tài)擴(kuò)充數(shù)組
  • 如果待排序的數(shù)據(jù)有小于0的數(shù)據(jù)呢?

4.總結(jié)

位圖算法遂跟,其需要一次遍歷整個(gè)數(shù)據(jù)逃沿,假如有N個(gè)數(shù)據(jù),就只是需要遍歷N次幻锁,所以時(shí)間復(fù)雜度
O(N)凯亮。但是,其需要額外地開(kāi)辟內(nèi)存空間哄尔,有N個(gè)數(shù)據(jù)假消,就需要多開(kāi)辟N bit位的數(shù)據(jù),
額外需要:N/8/1024/1024 MB 的空間岭接。假如是一億個(gè)數(shù)據(jù)富拗,那么大概要:11.92MB

代碼在這里

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末亿傅,一起剝皮案震驚了整個(gè)濱河市媒峡,隨后出現(xiàn)的幾起案子瘟栖,更是在濱河造成了極大的恐慌葵擎,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,029評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件半哟,死亡現(xiàn)場(chǎng)離奇詭異酬滤,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)寓涨,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,395評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門盯串,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人戒良,你說(shuō)我怎么就攤上這事体捏。” “怎么了糯崎?”我有些...
    開(kāi)封第一講書人閱讀 157,570評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵几缭,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我沃呢,道長(zhǎng)年栓,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書人閱讀 56,535評(píng)論 1 284
  • 正文 為了忘掉前任薄霜,我火速辦了婚禮某抓,結(jié)果婚禮上纸兔,老公的妹妹穿的比我還像新娘。我一直安慰自己否副,他們只是感情好汉矿,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,650評(píng)論 6 386
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著备禀,像睡著了一般负甸。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上痹届,一...
    開(kāi)封第一講書人閱讀 49,850評(píng)論 1 290
  • 那天呻待,我揣著相機(jī)與錄音,去河邊找鬼队腐。 笑死蚕捉,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的柴淘。 我是一名探鬼主播迫淹,決...
    沈念sama閱讀 39,006評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼为严!你這毒婦竟也來(lái)了敛熬?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 37,747評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤第股,失蹤者是張志新(化名)和其女友劉穎应民,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體夕吻,經(jīng)...
    沈念sama閱讀 44,207評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡诲锹,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,536評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了涉馅。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片归园。...
    茶點(diǎn)故事閱讀 38,683評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖稚矿,靈堂內(nèi)的尸體忽然破棺而出庸诱,到底是詐尸還是另有隱情,我是刑警寧澤晤揣,帶...
    沈念sama閱讀 34,342評(píng)論 4 330
  • 正文 年R本政府宣布桥爽,位于F島的核電站,受9級(jí)特大地震影響碉渡,放射性物質(zhì)發(fā)生泄漏聚谁。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,964評(píng)論 3 315
  • 文/蒙蒙 一滞诺、第九天 我趴在偏房一處隱蔽的房頂上張望形导。 院中可真熱鬧环疼,春花似錦、人聲如沸朵耕。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,772評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)阎曹。三九已至伪阶,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間处嫌,已是汗流浹背栅贴。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,004評(píng)論 1 266
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留熏迹,地道東北人檐薯。 一個(gè)月前我還...
    沈念sama閱讀 46,401評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像注暗,于是被迫代替她去往敵國(guó)和親坛缕。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,566評(píng)論 2 349

推薦閱讀更多精彩內(nèi)容

  • 在C語(yǔ)言中,五種基本數(shù)據(jù)類型存儲(chǔ)空間長(zhǎng)度的排列順序是: A)char B)char=int<=float C)ch...
    夏天再來(lái)閱讀 3,333評(píng)論 0 2
  • 國(guó)家電網(wǎng)公司企業(yè)標(biāo)準(zhǔn)(Q/GDW)- 面向?qū)ο蟮挠秒娦畔?shù)據(jù)交換協(xié)議 - 報(bào)批稿:20170802 前言: 排版 ...
    庭說(shuō)閱讀 10,932評(píng)論 6 13
  • 常見(jiàn)的排序算法: 快速排序捆昏、堆排序赚楚、歸并排序、選擇排序 插入排序骗卜、二分插入排序 冒泡排序宠页、雞尾酒排序 桶排序、計(jì)數(shù)...
    晴空歌閱讀 762評(píng)論 0 12
  • 一次又一次的降溫,才讓樹(shù)葉變黃门烂; 一回又一回的漠視乳愉,才把人心變涼; 讓一個(gè)人沉默的屯远,是另一個(gè)人的冷漠蔓姚; 讓一顆心受...
    奮鬥boy閱讀 617評(píng)論 0 0
  • 人生沒(méi)有白走的路,每一步都算數(shù)慨丐! 3個(gè)月團(tuán)練的日子眨眼就到了坡脐,最后一次的作業(yè)是這三個(gè)月的總結(jié)感悟。想想房揭,還是用21...
    阿盧走起閱讀 148評(píng)論 0 1