21.內(nèi)核網(wǎng)絡(luò)接口卡接口
DPDK Kernel NIC Interface(KNI)允許用戶空間應(yīng)用程序訪問Linux *控制面帮毁。
使用DPDK KNI的好處是:
- 比現(xiàn)有的Linux TUN / TAP接口更快(通過消除系統(tǒng)調(diào)用和copy_to_user()/copy_from_user()操作)。
- 允許使用標(biāo)準(zhǔn)Linux網(wǎng)絡(luò)工具(如ethtool黔牵,ifconfig和tcpdump)管理DPDK端口爷肝。
- 允許與內(nèi)核網(wǎng)絡(luò)堆棧的接口。
使用DPDK內(nèi)核NIC接口的應(yīng)用程序的組件如圖所示金赦。
21.1.DPDK KNI內(nèi)核模塊
KNI內(nèi)核可加載模塊支持兩種類型的設(shè)備:
- 其他設(shè)備:
- 創(chuàng)建網(wǎng)絡(luò)設(shè)備(通過ioctl調(diào)用)牧愁。
- 維護(hù)所有KNI實例共享的內(nèi)核線程上下文(模擬網(wǎng)絡(luò)驅(qū)動程序的RX端)猪半。
- 對于單內(nèi)核線程模式偷线,維護(hù)所有KNI實例共享的內(nèi)核線程上下文(模擬網(wǎng)絡(luò)驅(qū)動程序的RX端)。
- 對于多個內(nèi)核線程模式声邦,為每個KNI實例(模擬新驅(qū)動程序的RX側(cè))維護(hù)一個內(nèi)核線程上下文亥曹。
- 網(wǎng)絡(luò)設(shè)備:
- 通過實現(xiàn)由struct net_device定義的諸如netdev_ops,header_ops媳瞪,ethtool_ops之類的幾個操作提供的Net功能蛇受,包括支持DPDK mbufs和FIFO。
- 接口名稱由用戶空間提供。
- MAC地址可以是真正的NIC MAC地址或隨機(jī)的剂碴。
21.2. KNI創(chuàng)建及刪除
KNI接口由DPDK應(yīng)用程序動態(tài)創(chuàng)建轻专。接口名稱和FIFO詳細(xì)信息由應(yīng)用程序通過ioctl調(diào)用使用rte_kni_device_info結(jié)構(gòu)提供,該結(jié)構(gòu)包含:
- 接口名稱洪碳。
- 相關(guān)FIFO的相應(yīng)存儲器的物理地址叼屠。
- Mbuf mempool詳細(xì)信息,包括物理和虛擬(計算mbuf指針的偏移量)嫂侍。
- PCI信息荚坞。
- Core。
有關(guān)詳細(xì)信息各淀,請參閱DPDK源代碼中的rte_kni_common.h诡挂。
物理地址將重新映射到內(nèi)核地址空間,并存儲在單獨(dú)的KNI上下文中奴璃。
內(nèi)核RX線程(單線程和多線程模式)的親和力由force_bind和core_id配置參數(shù)控制城豁。
創(chuàng)建后,DPDK應(yīng)用程序可以動態(tài)刪除KNI接口雳旅。此外间聊,所有未刪除的KNI接口將在雜項設(shè)備(DPDK應(yīng)用程序關(guān)閉時)的釋放操作中被刪除。
21.3.DPDK緩沖區(qū)流
為了最小化在內(nèi)核空間中運(yùn)行的DPDK代碼的數(shù)量甸饱,mbuf mempool僅在用戶空間中進(jìn)行管理。內(nèi)核模塊可以感知mbufs偷遗,但是所有mbuf分配和釋放操作將僅由DPDK應(yīng)用程序處理。
21.4.用例: Ingress
在DPDK RX側(cè)喉酌,mbuf由PMD在RX線程上下文中分配泪电。該線程將mbuf入隊到rx_q FIFO中纪铺。 KNI線程將輪詢所有KNI活動設(shè)備。如果mbuf出隊突诬,它將被轉(zhuǎn)換為sk_buff芜繁,并通過netif_rx()發(fā)送到網(wǎng)絡(luò)協(xié)議棧。必須釋放出隊的mbuf骏令,將指針返回到free_q FIFO中榔袋。
RX線程在相同的主循環(huán)中輪詢該FIFO,并在出隊之后釋放mbuf摘昌。
21.5.用例: Egress
對于數(shù)據(jù)包出口聪黎,DPDK應(yīng)用程序必須首先入隊幾個mbufs才能在內(nèi)核端創(chuàng)建一個mbuf緩存备恤。
通過調(diào)用kni_net_tx()回調(diào),從Linux網(wǎng)絡(luò)堆棧接收數(shù)據(jù)包露泊。mbuf出隊(因為使用緩存惭笑,所以無需等待)生真,并填充了來自sk_buff的數(shù)據(jù)捺宗。然后釋放sk_buff,并將mbuf發(fā)送到tx_q FIFO长已。
DPDK TX線程執(zhí)行mbuf出隊昼牛,并將其發(fā)送到PMD(通過rte_eth_tx_burst())。 然后將mbuf放回緩存中胞四。
21.6.以太網(wǎng)工具
Ethtool是Linux專用工具伶椿,在內(nèi)核中具有相應(yīng)的支持,每個網(wǎng)絡(luò)設(shè)備必須為支持的操作注冊自己的回調(diào)游昼。目前的實現(xiàn)使用igb / ixgbe修改的Linux驅(qū)動程序進(jìn)行ethtool支持尝蠕。i40e和VM(VF或EM設(shè)備)不支持Ethtool。
21.7.鏈路狀態(tài)及MTU改變
鏈路狀態(tài)和MTU變化是通常通過ifconfig完成的網(wǎng)絡(luò)接口操作廊佩。該請求是從內(nèi)核端(在ifconfig進(jìn)程的上下文中)發(fā)起的靖榕,由用戶空間DPDK應(yīng)用程序處理。應(yīng)用程序輪詢請求料皇,調(diào)用應(yīng)用程序處理程序并將響應(yīng)返回到內(nèi)核空間星压。
應(yīng)用處理程序可以在創(chuàng)建接口時注冊,也可以在運(yùn)行時再注冊/卸載逊脯。這提供了多進(jìn)程方案(其中KNI在primary process中創(chuàng)建竣贪,在secondary process中處理回調(diào))的靈活性巩螃。約束是單個進(jìn)程可以注冊和處理請求匕争。