前言
這篇文章將深入介紹CAS
在JDK
具體的實現(xiàn)方式儿礼,填補Java源碼系列(7) -- AtomicInteger中相關(guān)內(nèi)容的空缺,主要從高層調(diào)用開始,經(jīng)歷JDK骂租、JNI和asm匯編,最終調(diào)用處理器CAS指令集雨席,帶你瀏覽整個實現(xiàn)過程菩咨。
閱讀需扎實Java基本功,了解或能看懂JNI和C語言陡厘。匯編沒看過也沒有關(guān)系抽米,文章參考鏈接附帶本文涉及所有匯編知識點以供查閱。
一糙置、什么是CAS
多處理云茸、多線程不可避免帶來了更多的元素同步處理。要在多線程環(huán)境中構(gòu)成同步原語(如信號量和互斥)谤饭,我們經(jīng)常會提到被稱為比較和交換 (CAS) 的原子操作标捺。
CAS的偽代碼:
compare_and_swap (*p, oldval, newval):
if (*p == oldval)
*p = newval;
success;
else
fail;
首先比較內(nèi)存位置 p (*p) 的內(nèi)容與已知值 oldval(這應該是當前線程中 *p 的值)。只有當它們是相同值時揉抵,才會將 newval 寫入 *p亡容。若其他線程之前已經(jīng)修改了內(nèi)存位置,那么比較操作會失敗冤今。
參考自內(nèi)聯(lián)匯編 - 從頭開始闺兢,有刪改
二、Unsafe
JDK8該方法名為compareAndSwapInt
戏罢,在Unsafe類中:
public final native boolean compareAndSwapInt(Object var1, long var2, int var4, int var5);
JDK9命名為compareAndSetInt
屋谭,也在Unsafe類中:
public final native boolean compareAndSetInt(Object var1, long var2, int var4, int var5);
本文用JDK9來介紹。如果你看的是JDK8也沒關(guān)系龟糕,我也稍微看了JDK8u的源碼桐磁,兩者JVM源碼文件路徑通用,實現(xiàn)或方法所在行數(shù)一致讲岁,只是方法簽名稍有差別我擂。
進入正題衬以,首先看該方法的原生實現(xiàn),對應unsafe.cpp文件的1198行扶踊,文件路徑jdk9/hotspot/src/share/vm/prims/
泄鹏。
下面unsafe.cpp尾段有個保存方法對應關(guān)系的靜態(tài)數(shù)組:
static JNINativeMethod jdk_internal_misc_Unsafe_methods[] = {
......
{CC "compareAndSetInt", CC "(" OBJ "J""I""I"")Z", FN_PTR(Unsafe_CompareAndSetInt)},
{CC "compareAndSetLong", CC "(" OBJ "J""J""J"")Z", FN_PTR(Unsafe_CompareAndSetLong)},
{CC "compareAndExchangeObject", CC "(" OBJ "J" OBJ "" OBJ ")" OBJ, FN_PTR(Unsafe_CompareAndExchangeObject)},
{CC "compareAndExchangeInt", CC "(" OBJ "J""I""I"")I", FN_PTR(Unsafe_CompareAndExchangeInt)},
{CC "compareAndExchangeLong", CC "(" OBJ "J""J""J"")J", FN_PTR(Unsafe_CompareAndExchangeLong)},
......
}
從查找對應關(guān)系知道compareAndSetInt
是Unsafe_CompareAndSetInt
,位于相同文件的1031行:
UNSAFE_ENTRY(jboolean, Unsafe_CompareAndSetInt(JNIEnv *env, jobject unsafe, jobject obj, jlong offset, jint e, jint x)) {
oop p = JNIHandles::resolve(obj);
jint* addr = (jint *)index_oop_from_field_offset_long(p, offset);
return (jint)(Atomic::cmpxchg(x, addr, e)) == e;
} UNSAFE_END
邏輯執(zhí)行流程:
-
obj
是AtomicInteger
對象秧耗,通過 JNIHandles::resolve() 獲取obj
在內(nèi)存中OOP實例p
- 根據(jù)成員變量
value
反射后計算出的內(nèi)存偏移值offset
去內(nèi)存中取指針addr
- 獲得更新值
x
备籽、指針addr
、期待值e
三個參數(shù)后分井,調(diào)用Atomic::cmpxchg(x, addr, e)
- 通過
Atomic::cmpxchg(x, addr, e)
實現(xiàn)CAS
三车猬、CAS本體
3.1 Atomic::cmpxchg
jdk9/hotspot/src/os_cpu/linux_x86/vm/atomic_linux_x86
第100行,并調(diào)用asm匯編尺锚。
注意:形參order是JDK9中新加的珠闰,JDK8u沒有該形參
inline jint Atomic::cmpxchg(jint exchange_value,
volatile jint* dest,
jint compare_value,
cmpxchg_memory_order order) {
int mp = os::is_MP();
__asm__ volatile (LOCK_IF_MP(%4) "cmpxchgl %1,(%3)"
: "=a" (exchange_value)
: "r" (exchange_value), "a" (compare_value), "r" (dest), "r" (mp)
: "cc", "memory");
return exchange_value;
}
按順序就是%1
到%4
,exchange_value是%1
瘫辩,dest是%3
伏嗜。r
代表任意一個寄存器,a
代表eax寄存器伐厌。
: "r" (exchange_value), "a" (compare_value), "r" (dest), "r" (mp)
經(jīng)過初步了解承绸,cmpxchgl就容易理解多了:
cmpxchgl %1,(%3)
奇怪的是%2
沒有用上,需要查證cmpxchgl的用法挣轨,它用到了一個隱含的操作數(shù)军熏,即eax。在前面的輸入操作數(shù)中卷扮,對應的%2沒有在匯編模板里出現(xiàn)荡澎,但通過修飾符a把它存放到了eax寄存器,因此這里被cmpxchg指令隱含使用晤锹。
指令cmpxchg比較eax(也就是compare_value)與dest的值摩幔。如果相等,那么將exchange_value的值賦值給dest鞭铆;否則热鞍,將dest的值賦值給eax。
: "=a" (exchange_value)
3.2 os::is_MP
方法is_MP()
實現(xiàn)在jdk9/hotspot/src/share/vm/runtime/os.hpp
206行:
int mp = os::is_MP();
用于獲取當前系統(tǒng)處理器核心數(shù)衔彻,如果_processor_count
在引導過程尚未初始化,就默認假設(shè)其是多處理器以保證線程安全偷办。
static int _processor_count; // number of processors
static int _initial_active_processor_count; // number of active processors during initialization.
// Interface for detecting multiprocessor system
static inline bool is_MP() {
// During bootstrap if _processor_count is not yet initialized
// we claim to be MP as that is safest. If any platform has a
// stub generator that might be triggered in this phase and for
// which being declared MP when in fact not, is a problem - then
// the bootstrap routine for the stub generator needs to check
// the processor count directly and leave the bootstrap routine
// in place until called after initialization has ocurred.
return (_processor_count != 1) || AssumeMP;
}
3.3 LOCK_IF_MP(mp)
獲取成功后把核心數(shù)保存在整形值mp
中艰额,實際起到布爾值的作用。為0意味系統(tǒng)是單處理器系統(tǒng)椒涯,大于0是多處理器系統(tǒng)柄沮,并作為實參調(diào)起宏定義LOCK_IF_MP(mp)
:
// Adding a lock prefix to an instruction on MP machine
#define LOCK_IF_MP(mp) "cmp $0, " #mp "; je 1f; lock; 1: "
宏定義用"cmp $0, " #mp "
檢查核心是否為單核:
- 是:跳到
1f
,執(zhí)行CPU指令cmpxchgl %1,(%3)
祖搓。1f
的意思是1after
,參看參考鏈接-6; - 不是:則跳到
1f
前先通過lock
給總線上鎖,令物理處理器的其他核心不能通過總線訪存羔杨,保證指令操作的原子性逞力。
值得一提的是卵皂,如果我們對一個變量使用volatile
修飾符捅膘,匯編中也會增加lock
指令前綴以保證該變量線程可見性和指令執(zhí)行有序性。
3.4 __asm__ volatile ("": : :"memory")
還有一個結(jié)構(gòu):
__asm__ volatile ("": : :"memory")
此結(jié)構(gòu)告訴編譯器添加一個內(nèi)存屏障禁止相關(guān)區(qū)域內(nèi)的操作指令重排序,但如何執(zhí)行還會受到具體處理器的影響箕别。詳見參考鏈接-3:
Creates a compiler level memory barrier forcing optimizer to not re-order memory accesses across the barrier.
3.5 偽代碼
說了這么多還是不易理解,畢竟上述代碼是C語言混編asm
,翻譯為Java-like
偽代碼:
// @param _processor_count processor count
// @param assumeMP assume is multiprocessor when is not yet initialized
// @param compare_value be comparing
// @param dest set as new value if true
@AsmVolatileMemory
private void isMultiProcessCAS(int _processor_count,
boolean assumeMP,
int compare_value,
int dest) {
if (_processor_count != 1 || assumeMP) {
lock();
}
cmpxchgl(compare_value, dest);
// Should unlock after cmpxchgl(int, int)???
}
有人提議參考鏈接-12把os::is_MP()
的AssumeMP
改為true
提升性能陷遮。且在2017-10-03的JDK10b13實現(xiàn)了該提議滓走,所以上述偽代碼可以進一步演進為:
// @param _processor_count processor count
// @param compare_value be comparing
// @param dest set as new value if true
@AsmVolatileMemory
private void isMultiProcessCAS(int _processor_count,
int compare_value,
int dest) {
if (_processor_count != 1) {
lock();
}
cmpxchgl(compare_value, dest);
// Should unlock after cmpxchgl(int, int)???
}
到這里Java CAS底層實現(xiàn)全部講解完畢。如果還有疑問帽馋,下面參考鏈接應該能給你所有需要的解答搅方。
四、參考鏈接
2. Assembly language je jump function - Stackoverflow
3. Working of asm volatile (“” : : : “memory”) - Stackoverflow
4. JNI: converting unsigned int to jint - Stackoverflow
5. CMPXCHG - Compare and Exchange
6. 1b and 1f in GNU assembly - Stackoverflow
7. cmp je/jg how they work in assembly - Stackoverflow
8. Intel x86 JUMP quick reference
9. 樸素linux: 內(nèi)聯(lián)匯編 - Github
10. 內(nèi)聯(lián)匯編 - 從頭開始 - IBM
12. JDK-8185062 : Set AssumeMP to true and deprecate the flag