dpvs學(xué)習(xí)筆記: 11 搭建 simple fnat

DPVS 測(cè)試需要的環(huán)境比較復(fù)雜蓝谨,按照官方文檔 simple fnat 測(cè)試一下單機(jī)雙臂 fnat. 關(guān)于安裝編繹沒啥好說的呕诉,按 github 做就可以,但是一定要打開 DEBUG 模式倦卖,并且日志級(jí)別也為 DEBUG

測(cè)試環(huán)境

ubuntu 16.04.5

# uname -a
Linux jjh-dpvs-test0 4.4.0-116-generic 140-Ubuntu SMP Mon Feb 12 21:23:04 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux
lspci -v | grep Eth
02:00.0 Ethernet controller: Intel Corporation I350 Gigabit Network Connection (rev 01)
02:00.1 Ethernet controller: Intel Corporation I350 Gigabit Network Connection (rev 01)
06:00.0 Ethernet controller: Intel Corporation 82574L Gigabit Network Connection
07:00.0 Ethernet controller: Intel Corporation 82574L Gigabit Network Connection

兩個(gè) I350 網(wǎng)卡用于測(cè)試释簿,剩于網(wǎng)卡用于 ssh 暫時(shí)不用

ip 分配

                              ┌───────────────────┐                      ┌────────────────┐
                              │        dpvs       │                      │                │
                              │                   │                      │  real server   │
                              │                   │              ┌──────?│10.20.34.24:6379│
                              │                   │              │       │                │
                              │                   │              │       │                │
                              │                   │              │       └────────────────┘
                        ┌─────┴───────┐     ┌─────┴───────┐      │                         
                        │             │     │             │      │                         
                        │             │     │             │──────┘                         
┌──────────────┐        │    dpdk1    │     │             │                                
│              │        │     VIP     │     │    dpdk0    │                                
│    client    │        │10.20.101.43:│     │     LIP     │                                
│  10.34.38.43 ├───────?│    6379     │     │10.20.102.41 │                                
│              │        │             │     │             │                                
└──────────────┘        │             │     │             │──────┐                         
                        │             │     │             │      │                         
                        └─────┬───────┘     └─────┬───────┘      │                         
                              │                   │              │       ┌────────────────┐
                              │                   │              │       │                │
                              │                   │              │       │  real server   │
                              │                   │              └──────?│10.20.74.41:6379│
                              │                   │                      │                │
                              └───────────────────┘                      │                │
                                                                         └────────────────┘

Client IP: 10.34.38.43 測(cè)試客戶端網(wǎng)卡
DPDK1 VIP: 10.20.101.43 wan 網(wǎng)卡
DPDK0 LIP: 10.20.102.41 lan 網(wǎng)卡
RS1: 10.20.34.24
RS2: 10.20.74.41

配置服務(wù)

wan 網(wǎng)卡添加 vip

dpip addr add 10.20.101.43/32 dev dpdk1

添加 wan 默認(rèn)路由

dpip route add default via 10.20.101.254 dev dpdk1

在 client 機(jī)器 ping vip 確保生效

ping 10.20.101.43
PING 10.20.101.43 (10.20.101.43) 56(84) bytes of data.
64 bytes from 10.20.101.43: icmp_seq=1 ttl=58 time=3.66 ms
64 bytes from 10.20.101.43: icmp_seq=2 ttl=58 time=3.52 ms

添加 ipvs service 輪循算法

ipvsadm -A -t 10.20.101.43:6379 -s rr

添加兩個(gè) rs

ipvsadm -a -t 10.20.101.43:6379 -r 10.20.34.24:6379 -b
ipvsadm -a -t 10.20.101.43:6379 -r 10.20.74.41:6379 -b

添加 lan lip

ipvsadm --add-laddr -z 10.20.102.41 -t 10.20.101.43:6379 -F dpdk0

添加 dpdk0 默認(rèn)路由

dpip route add default via 10.20.102.254 dev dpdk0

在 client 機(jī)器 ping lip 確保生效

ping 10.20.102.41
PING 10.20.102.41 (10.20.102.41) 56(84) bytes of data.
64 bytes from 10.20.102.41: icmp_seq=1 ttl=58 time=3.52 ms
64 bytes from 10.20.102.41: icmp_seq=2 ttl=58 time=3.43 ms

至少配置完成,這里走了些彎路洒试,由于歷史原因交換機(jī)配置導(dǎo)致 lip 不通倍奢。感謝 sys 組春波同學(xué)幫忙。

測(cè)試效果

redis-cli -h 10.20.101.43 -p 6379 get a

發(fā)現(xiàn)在測(cè)試機(jī)訪問 redis 服務(wù)失敗垒棋,排查看看到底哪里出了問題卒煞。

client 機(jī)器執(zhí)行

tcpdump port 6379 -i bond0 -n

rs 兩個(gè)機(jī)器執(zhí)行

tcpdump port 6379 -i bond0 -n

dpvs 觀察日志

tail -f /var/log/dpvs.log

然后再訪問 redis 服務(wù)

redis-cli -h 10.20.101.43 -p 6379 get a

測(cè)試 client 輸出

13:32:22.130615 IP 10.34.38.43.37943 > 10.20.101.43.6379: Flags [S], seq 1653003455, win 29200, options [mss 1460,nop,nop,sackOK,nop,wscale 7], length 0
13:32:23.127957 IP 10.34.38.43.37943 > 10.20.101.43.6379: Flags [S], seq 1653003455, win 29200, options [mss 1460,nop,nop,sackOK,nop,wscale 7], length 0

連續(xù)發(fā)了兩個(gè) syn 包,也就是說第一次 syn 超時(shí)后又重試了一次叼架。

看下 rs 輸出

13:32:22.127008 IP 10.20.102.41.1029 > 10.20.34.24.6379: Flags [S], seq 338949052, win 29200, options [exp-9437,mss 1460,nop,nop,sackOK,nop,wscale 7], length 0
13:32:22.127035 IP 10.20.34.24.6379 > 10.20.102.41.1029: Flags [S.], seq 930729927, ack 338949053, win 29200, options [mss 1460,nop,nop,sackOK,nop,wscale 7], length 0
13:32:23.123551 IP 10.20.34.24.6379 > 10.20.102.41.1029: Flags [S.], seq 930729927, ack 338949053, win 29200, options [mss 1460,nop,nop,sackOK,nop,wscale 7], length 0
13:32:23.124287 IP 10.20.102.41.1029 > 10.20.34.24.6379: Flags [S], seq 338949052, win 29200, options [exp-9437,mss 1460,nop,nop,sackOK,nop,wscale 7], length 0
13:32:23.124304 IP 10.20.34.24.6379 > 10.20.102.41.1029: Flags [S.], seq 930729927, ack 338949053, win 29200, options [mss 1460,nop,nop,sackOK,nop,wscale 7], length 0
13:32:25.123557 IP 10.20.34.24.6379 > 10.20.102.41.1029: Flags [S.], seq 930729927, ack 338949053, win 29200, options [mss 1460,nop,nop,sackOK,nop,wscale 7], length 0

可以看到 rs 10.20.34.24 己經(jīng)給 dpvs lip 10.20.102.41 回復(fù) syn+ack 包了畔裕,但是沒有完成第三次握手。

再來看下 dpvs 日志

IPVS: conn lookup: [6] TCP 10.34.38.43:37943 -> 10.20.101.43:6379 miss
SAPOOL: sa_pool_fetch: 10.20.102.41:1029 fetched!
IPVS: new conn:  [6] TCP 10.34.38.43:37943 10.20.101.43:6379 10.20.102.41:1029 10.20.34.24:6379 refs 2
IPVS: state trans: TCP in [S...] 10.34.38.43:37943->10.20.34.24:6379  state NONE->SYN_RECV conn.refcnt 2
IPVS: conn lookup: [3] TCP 10.20.34.24:6379 -> 10.20.102.41:1029 miss
IPVS: tcp_conn_sched: [3] try sched non-SYN packet: [S.A.] 10.20.34.24:6379->10.20.102.41:1029
IPVS: conn lookup: [3] TCP 10.20.34.24:6379 -> 10.20.102.41:1029 miss
IPVS: tcp_conn_sched: [3] try sched non-SYN packet: [S.A.] 10.20.34.24:6379->10.20.102.41:1029
IPVS: conn lookup: [6] TCP 10.34.38.43:37943 -> 10.20.101.43:6379 hit
IPVS: conn lookup: [3] TCP 10.20.34.24:6379 -> 10.20.102.41:1029 miss
IPVS: tcp_conn_sched: [3] try sched non-SYN packet: [S.A.] 10.20.34.24:6379->10.20.102.41:1029
IPVS: conn lookup: [3] TCP 10.20.34.24:6379 -> 10.20.102.41:1029 miss
IPVS: tcp_conn_sched: [3] try sched non-SYN packet: [S.A.] 10.20.34.24:6379->10.20.102.41:1029

首先乖订,可以看到從 sa_pool 中正確的獲取了本地端口 1029扮饶,然后將 syn 包轉(zhuǎn)發(fā)到了后端 rs 10.20.34.24, 狀態(tài)由 NONE 變成了 SYN_RECV

然后 dpvs 接到 rs 的 syn+ack 回包,去查找 session 流表時(shí)發(fā)現(xiàn) miss 然后就把包 drop 了乍构√鹞蓿可以看到數(shù)據(jù)是 cpu [6] 發(fā)送的,但是返程數(shù)據(jù)接收的是 cpu[3]

問題原因

由現(xiàn)象可以得知哥遮,是返程數(shù)據(jù)親和性問題岂丘,通過官方 issue 及文檔,得知 我的測(cè)試網(wǎng)卡 I350 暫時(shí)不支持 flow director, 所以只能用 1 worker 來測(cè)試昔善。下周申請(qǐng)萬兆網(wǎng)卡測(cè)試吧元潘,還得做性能測(cè)試。

小感概一下君仆,對(duì)于開源軟件翩概,如果不懂源碼有些問題真是無從下手。

更新20181204

在 sys 組春波和文強(qiáng)的幫助下返咱,換了萬兆網(wǎng)卡钥庇,simple fullnat 測(cè)試通過。下一步做單機(jī)的性能測(cè)試咖摹,最后是 ospf + funat

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末评姨,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌吐句,老刑警劉巖胁后,帶你破解...
    沈念sama閱讀 219,039評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異嗦枢,居然都是意外死亡攀芯,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門文虏,熙熙樓的掌柜王于貴愁眉苦臉地迎上來侣诺,“玉大人,你說我怎么就攤上這事氧秘∧暝В” “怎么了?”我有些...
    開封第一講書人閱讀 165,417評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵丸相,是天一觀的道長(zhǎng)搔确。 經(jīng)常有香客問我,道長(zhǎng)已添,這世上最難降的妖魔是什么妥箕? 我笑而不...
    開封第一講書人閱讀 58,868評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮更舞,結(jié)果婚禮上畦幢,老公的妹妹穿的比我還像新娘。我一直安慰自己缆蝉,他們只是感情好宇葱,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,892評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著刊头,像睡著了一般黍瞧。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上原杂,一...
    開封第一講書人閱讀 51,692評(píng)論 1 305
  • 那天印颤,我揣著相機(jī)與錄音,去河邊找鬼穿肄。 笑死年局,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的咸产。 我是一名探鬼主播矢否,決...
    沈念sama閱讀 40,416評(píng)論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼脑溢!你這毒婦竟也來了僵朗?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,326評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎验庙,沒想到半個(gè)月后顶吮,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,782評(píng)論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡壶谒,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,957評(píng)論 3 337
  • 正文 我和宋清朗相戀三年云矫,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片汗菜。...
    茶點(diǎn)故事閱讀 40,102評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖挑社,靈堂內(nèi)的尸體忽然破棺而出陨界,到底是詐尸還是另有隱情,我是刑警寧澤痛阻,帶...
    沈念sama閱讀 35,790評(píng)論 5 346
  • 正文 年R本政府宣布菌瘪,位于F島的核電站,受9級(jí)特大地震影響阱当,放射性物質(zhì)發(fā)生泄漏俏扩。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,442評(píng)論 3 331
  • 文/蒙蒙 一弊添、第九天 我趴在偏房一處隱蔽的房頂上張望录淡。 院中可真熱鬧,春花似錦油坝、人聲如沸嫉戚。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽彬檀。三九已至,卻和暖如春瞬女,著一層夾襖步出監(jiān)牢的瞬間窍帝,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工诽偷, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留坤学,地道東北人渤刃。 一個(gè)月前我還...
    沈念sama閱讀 48,332評(píng)論 3 373
  • 正文 我出身青樓略号,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親突梦。 傳聞我的和親對(duì)象是個(gè)殘疾皇子宫患,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,044評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容