Copy-On-Write簡稱COW蚕泽,是一種用于程序設(shè)計中的優(yōu)化策略惋啃。其基本思路是,從一開始大家都在共享同一個內(nèi)容规辱,當某個人想要修改這個內(nèi)容的時候,才會真正把內(nèi)容Copy出去形成一個新的內(nèi)容然后再改栽燕,這是一種延時懶惰策略罕袋。從JDK1.5開始Java并發(fā)包里提供了兩個使用CopyOnWrite機制實現(xiàn)的并發(fā)容器,它們是CopyOnWriteArrayList和CopyOnWriteArraySet。CopyOnWrite容器非常有用碍岔,可以在非常多的并發(fā)場景中使用到浴讯。
什么是CopyOnWrite容器
CopyOnWrite容器即寫時復(fù)制的容器。通俗的理解是當我們往一個容器添加元素的時候蔼啦,不直接往當前容器添加榆纽,而是先將當前容器進行Copy,復(fù)制出一個新的容器,然后新的容器里添加元素奈籽,添加完元素之后饥侵,再將原容器的引用指向新的容器。這樣做的好處是我們可以對CopyOnWrite容器進行并發(fā)的讀衣屏,而不需要加鎖躏升,因為當前容器不會添加任何元素。所以CopyOnWrite容器也是一種讀寫分離的思想狼忱,讀和寫不同的容器膨疏。
CopyOnWriteArrayList的實現(xiàn)原理
在使用CopyOnWriteArrayList之前,我們先閱讀其源碼了解下它是如何實現(xiàn)的钻弄。以下代碼是向ArrayList里添加元素佃却,可以發(fā)現(xiàn)在添加的時候是需要加鎖的,否則多線程寫的時候會Copy出N個副本出來窘俺。
public boolean add(T e) {
final ReentrantLock lock = this.lock;
lock.lock();
try {
Object[] elements = getArray();
int len = elements.length;
// 復(fù)制出新數(shù)組
Object[] newElements = Arrays.copyOf(elements, len + 1);
// 把新元素添加到新數(shù)組里
newElements[len] = e;
// 把原數(shù)組引用指向新數(shù)組
setArray(newElements);
return true;
} finally {
lock.unlock();
}
}
final void setArray(Object[] a) {
array = a;
}
讀的時候不需要加鎖饲帅,如果讀的時候有多個線程正在向ArrayList添加數(shù)據(jù),讀還是會讀到舊的數(shù)據(jù)瘤泪,因為寫的時候不會鎖住舊的ArrayList灶泵。
public E get(int index) {
return get(getArray(), index);
}
CopyOnWrite的應(yīng)用場景
CopyOnWrite并發(fā)容器用于讀多寫少的并發(fā)場景。比如白名單均芽,黑名單丘逸,商品類目的訪問和更新場景,假如我們有一個搜索網(wǎng)站掀宋,用戶在這個網(wǎng)站的搜索框中深纲,輸入關(guān)鍵字搜索內(nèi)容,但是某些關(guān)鍵字不允許被搜索劲妙。這些不能被搜索的關(guān)鍵字會被放在一個黑名單當中湃鹊,黑名單每天晚上更新一次。當用戶搜索時镣奋,會檢查當前關(guān)鍵字在不在黑名單當中币呵,如果在,則提示不能搜索侨颈。實現(xiàn)代碼如下:
package com.ifeve.book;
import java.util.Map;
import com.ifeve.book.forkjoin.CopyOnWriteMap;
/**
* 黑名單服務(wù)
*
* @author fangtengfei
*
*/
public class BlackListServiceImpl {
private static CopyOnWriteMap<String, Boolean> blackListMap = new CopyOnWriteMap<String, Boolean>(
1000);
public static boolean isBlackList(String id) {
return blackListMap.get(id) == null ? false : true;
}
public static void addBlackList(String id) {
blackListMap.put(id, Boolean.TRUE);
}
/**
* 批量添加黑名單
*
* @param ids
*/
public static void addBlackList(Map<String,Boolean> ids) {
blackListMap.putAll(ids);
}
}
package com.ifeve.book;
import java.util.Map;
import com.ifeve.book.forkjoin.CopyOnWriteMap;
/**
* 黑名單服務(wù)
*
* @author fangtengfei
*
*/
public class BlackListServiceImpl {
private static CopyOnWriteMap<String, Boolean> blackListMap = new CopyOnWriteMap<String, Boolean>(
1000);
public static boolean isBlackList(String id) {
return blackListMap.get(id) == null ? false : true;
}
public static void addBlackList(String id) {
blackListMap.put(id, Boolean.TRUE);
}
/**
* 批量添加黑名單
*
* @param ids
*/
public static void addBlackList(Map<String,Boolean> ids) {
blackListMap.putAll(ids);
}
}
代碼很簡單余赢,但是使用CopyOnWriteMap需要注意兩件事情:
- 減少擴容開銷。根據(jù)實際需要哈垢,初始化CopyOnWriteMap的大小妻柒,避免寫時CopyOnWriteMap擴容的開銷。
- 使用批量添加耘分。因為每次添加举塔,容器每次都會進行復(fù)制绑警,所以減少添加次數(shù),可以減少容器的復(fù)制次數(shù)央渣。如使用上面代碼里的addBlackList方法计盒。
CopyOnWrite的缺點
CopyOnWrite容器有很多優(yōu)點,但是同時也存在兩個問題芽丹,即內(nèi)存占用問題和數(shù)據(jù)一致性問題北启。所以在開發(fā)的時候需要注意一下。
內(nèi)存占用問題志衍。因為CopyOnWrite的寫時復(fù)制機制暖庄,所以在進行寫操作的時候聊替,內(nèi)存里會同時駐扎兩個對象的內(nèi)存楼肪,舊的對象和新寫入的對象(注意:在復(fù)制的時候只是復(fù)制容器里的引用,只是在寫的時候會創(chuàng)建新對象添加到新容器里惹悄,而舊容器的對象還在使用春叫,所以有兩份對象內(nèi)存)。如果這些對象占用的內(nèi)存比較大泣港,比如說200M左右暂殖,那么再寫入100M數(shù)據(jù)進去,內(nèi)存就會占用300M当纱,那么這個時候很有可能造成頻繁的Yong GC和Full GC呛每。之前我們系統(tǒng)中使用了一個服務(wù)由于每晚使用CopyOnWrite機制更新大對象,造成了每晚15秒的Full GC坡氯,應(yīng)用響應(yīng)時間也隨之變長晨横。
針對內(nèi)存占用問題,可以通過壓縮容器中的元素的方法來減少大對象的內(nèi)存消耗箫柳,比如手形,如果元素全是10進制的數(shù)字,可以考慮把它壓縮成36進制或64進制悯恍】饪罚或者不使用CopyOnWrite容器,而使用其他的并發(fā)容器涮毫,如ConcurrentHashMap瞬欧。
數(shù)據(jù)一致性問題。CopyOnWrite容器只能保證數(shù)據(jù)的最終一致性罢防,不能保證數(shù)據(jù)的實時一致性艘虎。所以如果你希望寫入的的數(shù)據(jù),馬上能讀到篙梢,請不要使用CopyOnWrite容器顷帖。
關(guān)于C++的STL中美旧,曾經(jīng)也有過Copy-On-Write的玩法,參見陳皓的《C++ STL String類中的Copy-On-Write》贬墩,后來榴嗅,因為有很多線程安全上的事,就被去掉了陶舞。
轉(zhuǎn)載自:http://ifeve.com/java-copy-on-write/