【算法與數(shù)據(jù)結(jié)構(gòu)專(zhuān)場(chǎng)】BitMap算法介紹

我們先來(lái)看個(gè)簡(jiǎn)單的問(wèn)題簿寂。

假如給你20億個(gè)非負(fù)數(shù)的int型整數(shù)漾抬,然后再給你一個(gè)非負(fù)數(shù)的int型整數(shù) t ,讓你判斷t是否存在于這20億數(shù)中常遂,你會(huì)怎么做呢纳令?

有人可能會(huì)用一個(gè)int數(shù)組,然后把20億個(gè)數(shù)給存進(jìn)去克胳,然后再循環(huán)遍歷一下就可以了平绩。

想一下,這樣的話漠另,時(shí)間復(fù)雜度是O(n)捏雌,所需要的內(nèi)存空間

4byte * 20億,一共需要80億個(gè)字節(jié)笆搓,

大概需要8GB的內(nèi)存空間性湿,顯然有些計(jì)算機(jī)的內(nèi)存一次是加載不了這么這么多的數(shù)據(jù)的。

初步優(yōu)化

按照上面的做法满败,時(shí)間復(fù)雜度是O(n)肤频,內(nèi)存是8GB,實(shí)際上我們是可以把時(shí)間復(fù)雜度降低到O(1)的算墨。

例如我們可以這樣來(lái)存數(shù)據(jù)宵荒,把一個(gè)int非負(fù)整數(shù)n作為數(shù)組下標(biāo),如果n存在净嘀,則對(duì)應(yīng)的值為1报咳,如果不存在,對(duì)應(yīng)的值為0面粮。例如數(shù)組arr[n] = 1少孝,表示n存在,arr[n] = 0表示n不存在熬苍。

那么稍走,我們就可以把20億個(gè)數(shù)作為下標(biāo)來(lái)存,之后直接判斷arr[t]的值柴底,如果arr[t] = 1婿脸,則代表存在,如果arr[t] = 0柄驻,則代表不存在狐树。這樣,我們就可以把時(shí)間復(fù)雜度降低到O(1)鸿脓。不過(guò)空間復(fù)雜度我們并沒(méi)有降低抑钟。還稍微大了點(diǎn)涯曲。

由于int非負(fù)整數(shù)一共有 2^31 個(gè),所以數(shù)組的大小需要 2^32 這么大在塔。

這里可能有人說(shuō)也可以用HashSet來(lái)存啊幻件,時(shí)間復(fù)雜度也是近似O(1)。不過(guò)這里需要說(shuō)明的是蛔溃,HashSet里面存的必須是對(duì)象绰沥,也就是說(shuō)需要把int包裝成Integer,顯然一個(gè)對(duì)象的話是更花銷(xiāo)內(nèi)存的贺待,需要對(duì)象頭啊什么的.....

再次優(yōu)化

大家想一個(gè)問(wèn)題徽曲,對(duì)于一個(gè)數(shù),實(shí)際上我們只需要兩種狀態(tài)麸塞,就是這個(gè)數(shù)存在不存在這兩種可能秃臣。上面我們用1代表存在,用0代表不存在喘垂。

也就是說(shuō)甜刻,我們是可以不用int型的數(shù)組來(lái)存儲(chǔ)的绍撞,一個(gè)int型占用4個(gè)字節(jié)正勒,即32個(gè)二進(jìn)制位,一共可以表示40億多個(gè)狀態(tài)傻铣。用int型的來(lái)存兩個(gè)狀態(tài)章贞,多浪費(fèi)。

所以我們可以考慮用boolean型的來(lái)存的非洲,boolean貌似就占用一個(gè)字節(jié)(java中的boolena貌似是占用一個(gè)字節(jié))鸭限。而一個(gè)boolean有true和false兩種狀態(tài),所以也是成立的两踏。這樣子的話占用的內(nèi)存就是2GB的內(nèi)存了败京。

這樣,就可以降低到之前的四分之1內(nèi)存了梦染。

最終優(yōu)化:bitmap

大家再想一個(gè)問(wèn)題赡麦,雖然boolean是表示兩種狀態(tài),但是boolean實(shí)際上占用了8bit啊帕识,按道理8bit是可以表示128種狀態(tài)的泛粹。而被我們拿來(lái)表示兩個(gè)狀態(tài),是否也有點(diǎn)浪費(fèi)了呢肮疗?

我們都知道晶姊,一個(gè)二進(jìn)制位,有0和1兩種狀態(tài)伪货,所以說(shuō)们衙,其實(shí)我們是可以用一個(gè)二進(jìn)制位來(lái)代表一個(gè)int型的數(shù)是否存在的钾怔。例如對(duì)于1,3蒙挑,5蒂教,7這四個(gè)數(shù),如果存在的話脆荷,則可以這樣表示:

image

1代表這個(gè)數(shù)存在凝垛,0代表不存在。例如表中01010101代表1蜓谋,3梦皮,5,7存在桃焕,0剑肯,2,4观堂,6不存在让网。

那如果8,10师痕,14也存在怎么存呢溃睹?如圖,8胰坟,10因篇,14我們可以存在第二個(gè)字節(jié)里

image

以此類(lèi)推。這樣子笔横,我們又可以把內(nèi)存降低到之前的8分之一了竞滓。

這種采用一個(gè)二進(jìn)制位來(lái)存儲(chǔ)數(shù)據(jù)的方法,我們也叫做bitmap算法吹缔。

可能有人會(huì)問(wèn)商佑,假如我要添加一個(gè)數(shù)n,我知道它要存在第n個(gè)位那里厢塘,把第n個(gè)二進(jìn)制改為1茶没,可是我要怎么操作呢?

這個(gè)對(duì)于bitmap算法是如何存儲(chǔ)的俗冻,如何進(jìn)行增刪操作的礁叔,我會(huì)在之后的文章里講,這篇就大概介紹下bitmap算法迄薄。

Java中有自帶的bitmap實(shí)現(xiàn)琅关,今天我們就用Java中自帶的bitmap來(lái)做道題練練手。我們換道類(lèi)似題目吧,不知道你一眼是否就能想到用bitmap算法來(lái)做涣易。

題目描述:

現(xiàn)在有五十億個(gè)int類(lèi)型的正整數(shù)画机,要從中找出重復(fù)的數(shù)并返回。

判斷50億個(gè)數(shù)有哪些是重復(fù)和剛才上面那個(gè)判斷是否存在新症,其實(shí)是一樣的步氏。我們采用bitmap算法來(lái)做。不過(guò)這里50億個(gè)數(shù)徒爹,別人肯定是以文件流的形式給你的荚醒。這樣我們?yōu)榱?strong>方便,我們就假設(shè)這些數(shù)是以存在int型數(shù)組的形式給我們的隆嗅。

代碼如下:

public class Test {
    //為了方便界阁,假設(shè)數(shù)據(jù)是以數(shù)組的形式給我們的
    public static Set<Integer> test(int[] arr) {
        int j = 0;
        //用來(lái)把重復(fù)的數(shù)返回,存在Set里胖喳,這樣避免返回重復(fù)的數(shù)泡躯。
        Set<Integer> output = new HashSet<>();
        BitSet bitSet = new BitSet(Integer.MAX_VALUE);
        int i = 0;
        while (i < arr.length) {
            int value = arr[i];
            //判斷該數(shù)是否存在bitSet里
            if (bitSet.get(value)) {
                output.add(value);
            } else {
                bitSet.set(value, true);
            }
            i++;
        }
        return output;
    }
    //測(cè)試
    public static void main(String[] args) {
        int[] t = {1,2,3,4,5,6,7,8,3,4};
        Set<Integer> t2 = test(t);
        System.out.println(t2);
    }
}

打印結(jié)果:

[3, 4]

當(dāng)然,bitmap算法的應(yīng)用不僅僅是節(jié)省內(nèi)存丽焊,它還有很多其他的優(yōu)點(diǎn)较剃。之后有機(jī)會(huì)就拿一些其他的應(yīng)用來(lái)寫(xiě)篇文章。

本次講解到此結(jié)束技健。如果喜歡写穴,可以分享給更多的小伙伴哦。

bitmap的存儲(chǔ)會(huì)在之后的文章講哦

獲取更多原創(chuàng)文章凫乖,可以關(guān)注下我的公眾號(hào):苦逼的碼農(nóng)确垫,我會(huì)不定期分享一些資源和軟件等弓颈。后臺(tái)回復(fù)禮包送你一份時(shí)下熱門(mén)的資源大禮包帽芽。同時(shí)也感謝把文章介紹給更多需要的人。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末翔冀,一起剝皮案震驚了整個(gè)濱河市导街,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌纤子,老刑警劉巖搬瑰,帶你破解...
    沈念sama閱讀 216,496評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異控硼,居然都是意外死亡泽论,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,407評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén)卡乾,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)翼悴,“玉大人,你說(shuō)我怎么就攤上這事幔妨○惺辏” “怎么了谍椅?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,632評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)古话。 經(jīng)常有香客問(wèn)我雏吭,道長(zhǎng),這世上最難降的妖魔是什么陪踩? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,180評(píng)論 1 292
  • 正文 為了忘掉前任杖们,我火速辦了婚禮,結(jié)果婚禮上肩狂,老公的妹妹穿的比我還像新娘胀莹。我一直安慰自己,他們只是感情好婚温,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,198評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布描焰。 她就那樣靜靜地躺著,像睡著了一般栅螟。 火紅的嫁衣襯著肌膚如雪荆秦。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,165評(píng)論 1 299
  • 那天力图,我揣著相機(jī)與錄音步绸,去河邊找鬼。 笑死吃媒,一個(gè)胖子當(dāng)著我的面吹牛瓤介,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播赘那,決...
    沈念sama閱讀 40,052評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼刑桑,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了募舟?” 一聲冷哼從身側(cè)響起祠斧,我...
    開(kāi)封第一講書(shū)人閱讀 38,910評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎拱礁,沒(méi)想到半個(gè)月后琢锋,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,324評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡呢灶,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,542評(píng)論 2 332
  • 正文 我和宋清朗相戀三年吴超,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片鸯乃。...
    茶點(diǎn)故事閱讀 39,711評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡鲸阻,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情赘娄,我是刑警寧澤仆潮,帶...
    沈念sama閱讀 35,424評(píng)論 5 343
  • 正文 年R本政府宣布,位于F島的核電站遣臼,受9級(jí)特大地震影響性置,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜揍堰,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,017評(píng)論 3 326
  • 文/蒙蒙 一鹏浅、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧屏歹,春花似錦隐砸、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,668評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至幽纷,卻和暖如春式塌,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背友浸。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,823評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工峰尝, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人收恢。 一個(gè)月前我還...
    沈念sama閱讀 47,722評(píng)論 2 368
  • 正文 我出身青樓武学,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親伦意。 傳聞我的和親對(duì)象是個(gè)殘疾皇子火窒,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,611評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容

  • 1. Java基礎(chǔ)部分 基礎(chǔ)部分的順序:基本語(yǔ)法,類(lèi)相關(guān)的語(yǔ)法默赂,內(nèi)部類(lèi)的語(yǔ)法沛鸵,繼承相關(guān)的語(yǔ)法,異常的語(yǔ)法缆八,線程的語(yǔ)...
    子非魚(yú)_t_閱讀 31,623評(píng)論 18 399
  • 表層習(xí)慣:午睡 訓(xùn)練結(jié)果:差 我的情緒:有點(diǎn)低落,覺(jué)得浪費(fèi)了很多時(shí)間 原因分析:中午吃的太飽了疾捍,而且吃的比較油膩奈辰,...
    傲嬌的島陽(yáng)君閱讀 199評(píng)論 0 0
  • 閱讀是碎片時(shí)間眾多娛樂(lè)方式中最不容易培養(yǎng)的一種。手機(jī)的普及加速催生了花樣繁多的社交工具乱豆,從QQ空間到微信朋友圈奖恰,再...
    RLee12閱讀 342評(píng)論 0 1
  • 在上學(xué)讀書(shū)的時(shí)候,對(duì)自己的人生,有過(guò)各種各樣的美好想象瑟啃,對(duì)于自己以后的生活方式论泛,也有各種遐想。在真正面對(duì)生活的時(shí)候...
    踐行而生閱讀 225評(píng)論 1 0