算法:BitMap

BitMap 算法

引導(dǎo)

如果我們現(xiàn)在有一堆數(shù)據(jù),[0 ,3 ,4 ,7 ,9 ,1 ,2 ,5 ,6 ,8 ,2 ,3 ,5 ,7 ,9 ,0 ,1 ,4 ,6 ,8],需要對(duì)數(shù)據(jù)進(jìn)行排重,只留下最原始的數(shù)據(jù)贾虽。
那么我們可以用如下方式實(shí)現(xiàn):


package main

import (
    "fmt"
)

func main() {
    //獲取到一個(gè)數(shù)組
    nums := []int{0, 3, 4, 7, 9, 1, 2, 5, 6, 8, 2, 3, 5, 7, 9, 0, 1, 4, 6, 8}

    //獲取一個(gè)排重?cái)?shù)組
    numMap := map[int]bool{}

    //排重后的結(jié)果
    newNums := []int{}

    for _, num := range nums {
        _, ok := numMap[num]
        if ok { //已經(jīng)存在了
            continue
        }
        //記錄重復(fù)狀態(tài)
        numMap[num] = true
        newNums = append(newNums, num)
    }

    fmt.Println("排除重復(fù)前:", nums)
    fmt.Println("排除重復(fù)后:", newNums)
    //排除重復(fù)前: [0 3 4 7 9 1 2 5 6 8 2 3 5 7 9 0 1 4 6 8]
    //排除重復(fù)后: [0 3 4 7 9 1 2 5 6 8]
}

流程如下

1 . 實(shí)例化一個(gè)map零远,存儲(chǔ)標(biāo)記。

image

2 . 如果數(shù)據(jù)存在宝踪,則改變狀態(tài)箭昵。

3 . 不存在的數(shù)據(jù)税朴,就加入到新的數(shù)組中。

4 . 排序完成家制。

不知小伙伴絕不覺得和計(jì)數(shù)排序的邏輯很像正林。當(dāng)然優(yōu)化方案也可以按照計(jì)數(shù)排序的方式。

缺點(diǎn)分析

針對(duì)數(shù)據(jù)量大的數(shù)據(jù)颤殴,我們需求的map就會(huì)很大觅廓。這樣占用的空間特別高。所以針對(duì)這種情況我們需要一種替代方案來完成涵但,海量數(shù)據(jù)排重操作杈绸。

BitMap

所謂的Bit-map就是用一個(gè)bit位來標(biāo)記某個(gè)元素對(duì)應(yīng)的Value, 而Key即是該元素矮瘟。由于采用了Bit為單位來存儲(chǔ)數(shù)據(jù)瞳脓,因此在存儲(chǔ)空間方面,可以大大節(jié)省

其實(shí)如果你知道計(jì)數(shù)排序的話澈侠,你就會(huì)發(fā)現(xiàn)這個(gè)和計(jì)數(shù)排序很像劫侧。

bitmap應(yīng)用

  1. 可進(jìn)行數(shù)據(jù)的快速查找,判重,刪除烧栋。
  2. 去重?cái)?shù)據(jù)而達(dá)到壓縮數(shù)據(jù).

目前bitmap在數(shù)據(jù)采集【大數(shù)據(jù)-爬蟲】環(huán)節(jié)非常有用写妥,比如對(duì)url去重。

bitmap 實(shí)現(xiàn)


package bitmap

import (
    "bytes"
    "sync"
)

type Bit uint64 //統(tǒng)一bit類型

const BitSize = 64 //每一個(gè)bit位存儲(chǔ)數(shù)據(jù)量
const IndexBit = 6 //位置位移數(shù)量

type Bitmap []Bit //bitmap

var mux = sync.Mutex{}

var bitsMap [BitSize]Bit

//func init() {
//  for i := 0; i < BitSize; i++ {
//      bitsMap[i] = Bit(0x01) << Bit(i)
//  }
//}


//設(shè)置bit
func (b *Bitmap) SetBit(value Bit, stat bool) *Bitmap {
    mux.Lock()
    defer mux.Unlock()
    index, pos := b.ValueToIndexAndPos(value)
    if stat {
        b.UpCapToIndex(index)
        //設(shè)置
        (*b)[index] |= Bit(0x01) << pos
    } else {
        //取消
        if index < len(*b) {
            (*b)[index] &^= Bit(0x01) << pos
        }
    }
    return b
}

func (b *Bitmap) Set(value Bit) *Bitmap {
    b.SetBit(value, true)
    return b
}

func (b *Bitmap) Unset(value Bit) *Bitmap {
    b.SetBit(value, false)
    return b
}

func (b *Bitmap) Get(value Bit) bool {
    index, pos := b.ValueToIndexAndPos(value)
    //(*b)[index] &^= Bit(0x01) << pos
    return index < len(*b) && ((*b)[index]&(Bit(0x01)<<pos) != 0)

}

func (b *Bitmap) ValueToIndexAndPos(value Bit) (int, Bit) {
    return int(value >> IndexBit), value % Bit(BitSize)
}

func (b *Bitmap) UpCapToIndex(index int) {
    toIndex := index + 1
    l := len(*b)
    if l < toIndex {
        l2 := 2 * l
        if toIndex < l2 {
            toIndex = l2
        }
        n := make([]Bit, toIndex, toIndex)
        copy(n, *b)
        *b = n
    }
}

func (b *Bitmap) ToString(split ...string) string {
    l := len(*b)
    sl := len(split)
    ss := ""
    if sl > 0 {
        ss = split[0]
    }
    str := ""
    for i := 0; i < l; i++ {
        if i > 0 && sl > 0 {
            str += ss
        }
        str += (*b)[i].ToString()
    }
    return str
}

func (bit *Bit) ToString() string {
    b := &bytes.Buffer{}
    t := *bit
    for i := 0; i < BitSize; i++ {
        if (t & bitsMap[i]) != 0 {
            b.WriteString("1")
        } else {
            b.WriteString("0")
        }
    }
    return b.String()
}


關(guān)鍵技能解析

位運(yùn)算

為了更好描述效果审姓,這里我們使用較小的數(shù)據(jù)類型: byte 珍特,一個(gè)byte包含8bit位。

package main

import (
    "fmt"
    "github.com/imroc/biu"
)

func main() {
    var b byte
    b = 1
    fmt.Println("常規(guī)展示:", b)                         // 原始數(shù)據(jù): 1
    fmt.Println("二進(jìn)制位:", biu.ByteToBinaryString(b)) //二進(jìn)制方式:00000001

    //向左移動(dòng)一位
    b = b << 1
    fmt.Println("左邊移動(dòng)一位:", b) // 原始數(shù)據(jù): 2
    fmt.Println("二進(jìn)制位:", biu.ByteToBinaryString(b)) //二進(jìn)制方式:00000010

    var b1 byte = 3

    fmt.Println("b1=:", b1) // 原始數(shù)據(jù): 3
    fmt.Println("二進(jìn)制位:", biu.ByteToBinaryString(b1)) //二進(jìn)制方式:00000011


    // 或(|) 運(yùn)算: 二進(jìn)制位中對(duì)應(yīng)位置有1則為1魔吐,否則為0扎筒。
    // 2 的二進(jìn)制為:  10  , 3 的二進(jìn)制為: 11
    // 那么 2|3 = 11


    fmt.Println("(2|3)二進(jìn)制位:", biu.ByteToBinaryString(2|3)) //二進(jìn)制方式:00000011


    // 與(&) 運(yùn)算: 二進(jìn)制位中對(duì)應(yīng)位置都為1則為1画畅,否則為0砸琅。
    // 2 的二進(jìn)制為:  10  , 3 的二進(jìn)制為: 11
    // 那么 2&3 = 10


    fmt.Println("(2&3)二進(jìn)制位:", biu.ByteToBinaryString(2&3)) //二進(jìn)制方式:00000010


    //異或(^)運(yùn)算: 二進(jìn)制中對(duì)應(yīng)位置不同的為1轴踱,否則為0.
    // 2 的二進(jìn)制為:  10  症脂, 3 的二進(jìn)制為: 11
    // 那么 2^3 = 01
    fmt.Println("(2^3)二進(jìn)制位:", biu.ByteToBinaryString(2^3)) //二進(jìn)制方式:00000001

    var c = byte(2)
    //取反(^):二進(jìn)制中的所有位置 0 為1,1為 0.
    fmt.Println("(^2)常規(guī)輸出:", ^c) //二進(jìn)制方式:253
    fmt.Println("(^2)二進(jìn)制位:", biu.ByteToBinaryString(^c)) //二進(jìn)制方式:11111101

}

Bitmap使用


    bm := &bitmap.Bitmap{} //實(shí)例化bitmap
    
    bm.SetBit(100, true) //設(shè)置位置100
    bm.SetBit(12, true)
    bm.SetBit(1, true)
    bm.SetBit(12, true) //設(shè)置位置12
    
    
    //獲取狀態(tài)
    fmt.Println("bit:100:",bm.Get(100)) //true
    fmt.Println("bit:12:",bm.Get(12)) //true

    //取消設(shè)置
    bm.SetBit(12, false)
    fmt.Println("bit:12:",bm.Get(12)) //false


長按二維碼關(guān)注我們
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市淫僻,隨后出現(xiàn)的幾起案子诱篷,更是在濱河造成了極大的恐慌,老刑警劉巖雳灵,帶你破解...
    沈念sama閱讀 218,386評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件棕所,死亡現(xiàn)場離奇詭異,居然都是意外死亡悯辙,警方通過查閱死者的電腦和手機(jī)琳省,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,142評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來躲撰,“玉大人针贬,你說我怎么就攤上這事÷5埃” “怎么了桦他?”我有些...
    開封第一講書人閱讀 164,704評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長谆棱。 經(jīng)常有香客問我快压,道長,這世上最難降的妖魔是什么垃瞧? 我笑而不...
    開封第一講書人閱讀 58,702評(píng)論 1 294
  • 正文 為了忘掉前任蔫劣,我火速辦了婚禮,結(jié)果婚禮上个从,老公的妹妹穿的比我還像新娘拦宣。我一直安慰自己等浊,他們只是感情好届腐,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,716評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著荒典,像睡著了一般意推。 火紅的嫁衣襯著肌膚如雪豆瘫。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,573評(píng)論 1 305
  • 那天菊值,我揣著相機(jī)與錄音外驱,去河邊找鬼。 笑死腻窒,一個(gè)胖子當(dāng)著我的面吹牛昵宇,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播儿子,決...
    沈念sama閱讀 40,314評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼瓦哎,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼!你這毒婦竟也來了柔逼?” 一聲冷哼從身側(cè)響起蒋譬,我...
    開封第一講書人閱讀 39,230評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎愉适,沒想到半個(gè)月后犯助,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,680評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡维咸,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,873評(píng)論 3 336
  • 正文 我和宋清朗相戀三年剂买,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片癌蓖。...
    茶點(diǎn)故事閱讀 39,991評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡瞬哼,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出费坊,到底是詐尸還是另有隱情倒槐,我是刑警寧澤,帶...
    沈念sama閱讀 35,706評(píng)論 5 346
  • 正文 年R本政府宣布附井,位于F島的核電站讨越,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏永毅。R本人自食惡果不足惜把跨,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,329評(píng)論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望沼死。 院中可真熱鬧着逐,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,910評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至秀姐,卻和暖如春慈迈,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背省有。 一陣腳步聲響...
    開封第一講書人閱讀 33,038評(píng)論 1 270
  • 我被黑心中介騙來泰國打工痒留, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人蠢沿。 一個(gè)月前我還...
    沈念sama閱讀 48,158評(píng)論 3 370
  • 正文 我出身青樓伸头,卻偏偏與公主長得像,于是被迫代替她去往敵國和親舷蟀。 傳聞我的和親對(duì)象是個(gè)殘疾皇子恤磷,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,941評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 偶然看到Bitmap算法,利用閑暇時(shí)間仔細(xì)深入研究一番雪侥,這里談?wù)勎业母形颉?一碗殷、算法思想 在日常編程過程中,我們熟...
    Hayde閱讀 1,662評(píng)論 1 2
  • 關(guān)于Mongodb的全面總結(jié) MongoDB的內(nèi)部構(gòu)造《MongoDB The Definitive Guide》...
    中v中閱讀 31,936評(píng)論 2 89
  • 我愛你,就像魚愛上貓旬牲,至死不渝仿粹。 我愛你,就像香煙愛上火柴原茅,寧死不悔吭历。 我愛你,就像冰雪遇上暖陽擂橘,愿卒于你晌区。 那天...
    石頭也向陽閱讀 573評(píng)論 6 3
  • 一次大學(xué)社團(tuán)聚餐,大家一頓胡吃海喝之后就開啟暢聊模式通贞,我摸出了煙走到小店門口朗若,開始了吞云吐霧的技能。不一會(huì)昌罩,從里面...
    牛腩粥閱讀 569評(píng)論 0 1
  • 情竇初開埋新酒哭懈, 一紙相思賦春秋。 燈盡油枯心空瘦茎用。 肝腸寸斷方知寒遣总。
    歲月便是天涯閱讀 201評(píng)論 0 0