聊一聊Linux网络性能王者——XDP技术

吾爱主题阅读：761 2024-04-05 16:16:33 评论：0

大家好，今天我们通过几张图来聊一聊XDP技术。

XDP技术对于很多Linux开发人员来说是一个很陌生的技术，如果你是一个Linux开发人员，恰好你从事的网络相关的开发工作，如果你不懂XDP技术，这是一个非常大的损失。

这个是我一个真实的经历，曾经我采用XDP技术优化过一个项目，让一个项目的网络处理性能提高了3-4倍，可能很多小伙伴会怀疑项目原本性能就很差，所以才会有很大的提升空间。

我想说的是，按照原来的软件架构，不管你怎么优化，性能的瓶颈是不可能突破的，唯一的方式是采用更高效的架构，从更高维度去解决问题。

后续我的项目魔法盒子也会用上XDP技术，采用XDP技术后，魔法盒子的网络性能估计能够提高3倍左右。

1.XDP技术简介

1.1 XDP技术背景

随着超高带宽网络技术10G，40G，100G网络的出现，Linux内核协议栈越来越不能适应新的网络技术的发展，Linux内核协议栈似乎成为了网络性能的瓶颈和鸡肋，为了解决这个尴尬的处境，Linux内核引入了一个新的技术内核旁路(Kernel Bypass)技术，内核旁路技术的核心思想是网络数据包跳过内核协议栈，直接由用户程序处理，这样可以避免内核协议栈的开销，大大提高网络性能。

XDP就是属于Linux自己的内核旁路技术，与之对应的还有一种内核旁路技术DPDK技术，DPDK拥有非常不错的性能，但是DPDK技术并不非常适用于Linux系统。

1.2 XDP是什么？

XDP是一种Linux内核技术，通过使用eBPF机制，在内核空间中实现高性能的数据包处理和转发。

它可以显著提高网络性能，并提供了灵活的编程接口，使用户能够实现各种自定义的网络功能，与传统的用户空间数据包处理相比，XDP可以显著降低数据包处理的延迟和CPU占用。

XDP技术工作模式：

原生模式（性能高，需要网卡支持）驱动模式，将XDP程序运行在网卡驱动中，从网卡驱动中将网络数据包重定向，该模式支持的网卡较多且性能也很高，如果网卡支持的话，尽量使用该模式。

卸载模式（性能最高，支持的网卡最少）将XDP程序直接卸载到网卡，该模式支持的网卡少，暂不做讨论。

通用模式（性能良好，Linux内核支持最好）XDP程序运行在Linux内核协议栈入口，无需驱动支持，性能低于XDP其他的两种模式，但是即使XDP通用模式，也会给你的系统性能带来一定的提升。

后续会有专门的专题来讲XDP技术，这里不展开讨论。

2.AF_XDP工作原理

2.1 整体架构

很多同学容易将XDP和AF_XDP技术给弄混淆。

XDP技术是基于BPF技术的一种新的网络技术。
AF_XDP是XDP技术的一种应用场景，AF_XDP是一种高性能Linux socket。

AF_XDP需要通过socket函数创建。

socket(AF_XDP, SOCK_RAW, 0);

AF_XDP技术会涉及到一些比较重要的知识点：

图片

AF_XDP想要XDP程序配合，才能完成网络数据包收发。
XDP程序主要工作是根据以太网帧的相关信息如：MAC地址，五元组信息等，进行数据包的过滤和重定向。
AF_XDP处理的是以太网数据帧，所以用户程序发送和接收的是以太网数据帧。
用户程序，AF_XDP，XDP会操作一个共享的内存区域，称之为UMEM。
网络数据包的接收和发送需要用到4个无锁环形队列。

2.2 UMEM共享内存

UMEM共享内存通过setsockopt函数进行申请。

setsockopt(umem->fd, SOL_XDP, XDP_UMEM_REG, &mr, sizeof(mr));

UMEM共享内存通常以4K为一个单元，每个单元可以存储一个数据包，UMEM共享内存通常为4096个单元。

接收和发送的数据包都是存储在UMEM内存单元。

用户程序和内核都可以直接操作这块内存区域，所以发送和接收数据包时，只是简单的内存拷贝，不需要进行系统调用。

用户程序需要维护一个UMEM内存使用记录，记录每一个UMEM单元是否已被使用，每个记录都会有一个相对地址，用于定位UMEM内存单元地址。

2.2 无锁环形队列

AF_XDP socket总共有4个无锁环形队列，分别为：

填充队列（FILL RING）
已完成队列（COMPLETION RING）
发送队列（TX RING）
接收队列（RX RING）

图片

环形队列创建方式：

//创建FILL RINGsetsockopt(fd, SOL_XDP, XDP_UMEM_FILL_RING,&umem->config.fill_size,               sizeof(umem->config.fill_size));             //创建COMPLETION RINGsetsockopt(fd, SOL_XDP, XDP_UMEM_COMPLETION_RING,&umem->config.comp_size,               sizeof(umem->config.comp_size));//创建RX RING     setsockopt(xsk->fd, SOL_XDP, XDP_RX_RING,&xsk->config.rx_size,                   sizeof(xsk->config.rx_size));//创建TX RING                setsockopt(xsk->fd, SOL_XDP, XDP_TX_RING, &xsk->config.tx_size,                   sizeof(xsk->config.tx_size));

4个环形队列实现方式基本相同，环形队列是对数组进行封装的数据结构，环形队列由5个重要部分组成：