4.7 JAVA計數(shù)器

你也許經(jīng)常需要一個計數(shù)器來了解數(shù)據(jù)庫或文本文件中一些事務(wù)出現(xiàn)的頻率(例如單詞)填抬。通過在Java中計數(shù)器可以通過HashMap可以輕松實現(xiàn)計數(shù)器。本文比較了實現(xiàn)不同的計數(shù)器方法。

更新: 查看Java8 計數(shù)器,寫一個計數(shù)器現(xiàn)在只是簡單的2行代碼菱阵。

1.基本計數(shù)器

樸素計數(shù)器可以如下實現(xiàn):

String s = "one two three two three three";
String[] sArr = s.split(" ");
 
//naive approach     
HashMap<String, Integer> counter = new HashMap<String, Integer>();
 
for (String a : sArr) {
    if (counter.containsKey(a)) {
        int oldValue = counter.get(a);
        counter.put(a, oldValue + 1);
    } else {
        counter.put(a, 1);
    }
}

在每個循環(huán)中,你檢查key是否存在绊诲。如果是送粱,則將舊值增加1,否則將其設(shè)置為1掂之,這種方法很簡單直接抗俄,但是它不是最有效的方法脆丁,由于以下方法,該方法被認為是低效的动雹。

  • containsKey()槽卫,get()在一個key存在時候,被調(diào)用了兩次胰蝠,這意味了搜索了Map兩次歼培。
  • 既然Integer是不可變的,每次循環(huán)將創(chuàng)建一個新的值來替代增加的舊值茸塞。

2.更好的計數(shù)器

自然地躲庄,我們希望有一個可變的Integer來避免穿件很多Integer對象。一個可變的Integer 類如下定義:

class MutableInteger {
 
    private int val;
 
    public MutableInteger(int val) {
        this.val = val;
    }
 
    public int get() {
        return val;
    }
 
    public void set(int val) {
        this.val = val;
    }
 
    //used to print value convinently
    public String toString(){
        return Integer.toString(val);
    }
}

計數(shù)器代碼改變?nèi)缦拢?/p>

HashMap<String, MutableInteger> newCounter = new HashMap<String, MutableInteger>(); 
 
for (String a : sArr) {
    if (newCounter.containsKey(a)) {
        MutableInteger oldValue = newCounter.get(a);
        oldValue.set(oldValue.get() + 1);
    } else {
        newCounter.put(a, new MutableInteger(1));
    }
}

這是更好钾虐,因為不需要創(chuàng)建許多Integer對象噪窘。但是存在key鍵,仍然搜索兩次效扫。

3. 更高效計數(shù)器

HashMap.put(key, value) 方法返回鍵的當(dāng)前值倔监。這是有用的,因為我們可以使用舊值的引用來更新值菌仁,而不用再搜索一次浩习。

HashMap<String, MutableInteger> efficientCounter = new HashMap<String, MutableInteger>();
 
for (String a : sArr) {
    MutableInteger initValue = new MutableInteger(1);
    MutableInteger oldValue = efficientCounter.put(a, initValue);
 
    if(oldValue != null){
        initValue.set(oldValue.get() + 1);
    }
}

4.性能表現(xiàn)差異

為測試三種不同方法的性能,使用下面的代碼济丘,性能測試100萬次谱秽,原始結(jié)果如下:

Naive Approach :  222796000
Better Approach:  117283000
Efficient Approach:  96374000

差別是顯著的,223 vs 117 vs 96 基礎(chǔ)計數(shù)器和高效計數(shù)器相差巨大闪盔,說明創(chuàng)建對象是昂貴的弯院。

String s = "one two three two three three";
String[] sArr = s.split(" ");
 
long startTime = 0;
long endTime = 0;
long duration = 0;
 
// naive approach
startTime = System.nanoTime();
HashMap<String, Integer> counter = new HashMap<String, Integer>();
 
for (int i = 0; i < 1000000; i++)
    for (String a : sArr) {
        if (counter.containsKey(a)) {
            int oldValue = counter.get(a);
            counter.put(a, oldValue + 1);
        } else {
            counter.put(a, 1);
        }
    }
 
endTime = System.nanoTime();
duration = endTime - startTime;
System.out.println("Naive Approach :  " + duration);
 
// better approach
startTime = System.nanoTime();
HashMap<String, MutableInteger> newCounter = new HashMap<String, MutableInteger>();
 
for (int i = 0; i < 1000000; i++)
    for (String a : sArr) {
        if (newCounter.containsKey(a)) {
            MutableInteger oldValue = newCounter.get(a);
            oldValue.set(oldValue.get() + 1);
        } else {
            newCounter.put(a, new MutableInteger(1));
        }
    }
 
endTime = System.nanoTime();
duration = endTime - startTime;
System.out.println("Better Approach:  " + duration);
 
// efficient approach
startTime = System.nanoTime();
 
HashMap<String, MutableInteger> efficientCounter = new HashMap<String, MutableInteger>();
 
for (int i = 0; i < 1000000; i++)
    for (String a : sArr) {
        MutableInteger initValue = new MutableInteger(1);
        MutableInteger oldValue = efficientCounter.put(a, initValue);
 
        if (oldValue != null) {
            initValue.set(oldValue.get() + 1);
        }
    }
 
endTime = System.nanoTime();
duration = endTime - startTime;
System.out.println("Efficient Approach:  " + duration);

在你進行計數(shù)的時候,可能需要Map的按值排序泪掀,可以看下Map按照值排序.

5.來自Keith解決方案

添加了幾個測試:
1) 重構(gòu)“更好方法”只是調(diào)用get而不是containsKey听绳,通常你想要的元素在HashMap,只需要搜索一次异赫。
2)添加一個AtomicInteger來進行測試椅挣,
3)與單獨的int數(shù)組相比,根據(jù)http://amzn.com/0748614079使用較少的內(nèi)存
我運行測試程序三次塔拳,并且采取最小的值鼠证,以消除與其他程序的方差。注意靠抑,你不能在程序中這樣做量九,這樣結(jié)果可能受GC影響而不同。

Naive: 201716122
Better Approach: 112259166
Efficient Approach: 93066471
Better Approach (without containsKey): 69578496
Better Approach (without containsKey, with AtomicInteger): 94313287
Better Approach (without containsKey, with int[]): 65877234

更好的辦法(沒有containsKey):

HashMap<String, MutableInteger> efficientCounter2 = new HashMap<String, MutableInteger>();
for (int i = 0; i < NUM_ITERATIONS; i++) {
    for (String a : sArr) {
        MutableInteger value = efficientCounter2.get(a);
 
        if (value != null) {
            value.set(value.get() + 1);
        } else {
            efficientCounter2.put(a, new MutableInteger(1));
        }
    }
}

更好的辦法(沒有containsKey,用AutomicInteger):

HashMap<String, AtomicInteger> atomicCounter = new HashMap<String, AtomicInteger>();
for (int i = 0; i < NUM_ITERATIONS; i++) {
    for (String a : sArr) {
        AtomicInteger value = atomicCounter.get(a);
 
        if (value != null) {
            value.incrementAndGet();
        } else {
            atomicCounter.put(a, new AtomicInteger(1));
        }
    }
}

更好的方法(沒用containsKey ,用int[]):

HashMap<String, int[]> intCounter = new HashMap<String, int[]>();
for (int i = 0; i < NUM_ITERATIONS; i++) {
    for (String a : sArr) {
        int[] valueWrapper = intCounter.get(a);
 
        if (valueWrapper == null) {
            intCounter.put(a, new int[] { 1 });
        } else {
            valueWrapper[0]++;
        }
    }
}

Guava的MultiSet可能更快荠列。

6 .結(jié)論

計數(shù)器效率比較
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末类浪,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子肌似,更是在濱河造成了極大的恐慌费就,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,607評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件川队,死亡現(xiàn)場離奇詭異力细,居然都是意外死亡,警方通過查閱死者的電腦和手機固额,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,239評論 3 395
  • 文/潘曉璐 我一進店門眠蚂,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人对雪,你說我怎么就攤上這事河狐。” “怎么了瑟捣?”我有些...
    開封第一講書人閱讀 164,960評論 0 355
  • 文/不壞的土叔 我叫張陵,是天一觀的道長栅干。 經(jīng)常有香客問我迈套,道長,這世上最難降的妖魔是什么碱鳞? 我笑而不...
    開封第一講書人閱讀 58,750評論 1 294
  • 正文 為了忘掉前任桑李,我火速辦了婚禮,結(jié)果婚禮上窿给,老公的妹妹穿的比我還像新娘贵白。我一直安慰自己,他們只是感情好崩泡,可當(dāng)我...
    茶點故事閱讀 67,764評論 6 392
  • 文/花漫 我一把揭開白布禁荒。 她就那樣靜靜地躺著,像睡著了一般角撞。 火紅的嫁衣襯著肌膚如雪呛伴。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,604評論 1 305
  • 那天谒所,我揣著相機與錄音热康,去河邊找鬼。 笑死劣领,一個胖子當(dāng)著我的面吹牛姐军,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 40,347評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼奕锌,長吁一口氣:“原來是場噩夢啊……” “哼著觉!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起歇攻,我...
    開封第一講書人閱讀 39,253評論 0 276
  • 序言:老撾萬榮一對情侶失蹤固惯,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后缴守,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體葬毫,經(jīng)...
    沈念sama閱讀 45,702評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,893評論 3 336
  • 正文 我和宋清朗相戀三年屡穗,在試婚紗的時候發(fā)現(xiàn)自己被綠了贴捡。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,015評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡村砂,死狀恐怖烂斋,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情础废,我是刑警寧澤汛骂,帶...
    沈念sama閱讀 35,734評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站评腺,受9級特大地震影響帘瞭,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜蒿讥,卻給世界環(huán)境...
    茶點故事閱讀 41,352評論 3 330
  • 文/蒙蒙 一蝶念、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧芋绸,春花似錦媒殉、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,934評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至舷夺,卻和暖如春苦酱,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背给猾。 一陣腳步聲響...
    開封第一講書人閱讀 33,052評論 1 270
  • 我被黑心中介騙來泰國打工疫萤, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人敢伸。 一個月前我還...
    沈念sama閱讀 48,216評論 3 371
  • 正文 我出身青樓扯饶,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子尾序,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,969評論 2 355

推薦閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理钓丰,服務(wù)發(fā)現(xiàn),斷路器每币,智...
    卡卡羅2017閱讀 134,657評論 18 139
  • Translate from Efficient Counter in Java Java中的高效計數(shù)器 你可能經(jīng)...
    MrDTree閱讀 4,665評論 1 3
  • 1. Java基礎(chǔ)部分 基礎(chǔ)部分的順序:基本語法携丁,類相關(guān)的語法,內(nèi)部類的語法兰怠,繼承相關(guān)的語法梦鉴,異常的語法,線程的語...
    子非魚_t_閱讀 31,639評論 18 399
  • java筆記第一天 == 和 equals ==比較的比較的是兩個變量的值是否相等揭保,對于引用型變量表示的是兩個變量...
    jmychou閱讀 1,500評論 0 3
  • 今天秸侣,我們推送的是狄金森的《沒有一艘船能像一本書》“書中自有顏如玉存筏,書中自有黃金屋”是我們再熟悉不過的名言,讀一本...
    謝娜1011閱讀 112評論 0 0