本文主要是介绍Linux tun/tap 驱动多队列模式(C/C++),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
LINUX 内核在3.X版本才支持,正式是到 4.1 版本内核才加入到内核之中被支持,所以相对来说距今时间上来说是比较新的一种扩展技术。
多队列模式的 tun/tap 可以显著的提高,单个 tun/tap 网卡的带宽吞吐速度,但肯定没有 DPDK 那种零拷贝不内核切换的效率高。
一般来说,tun/tap 的效率与内核直接处理网卡数据速度,大约差距至少5倍左右,即 1000Mbps,tun/tap 最大用户层可以达到 200Mbps,实际上大多数情况达不到。
以玩客云S805晶片为例,单核拉满在300Mbps 左右,三核拉满达到最大速度就是900Mbps,虽然是1000Mbps 的网卡口子,但是芯片处理不了那么大的数据吞吐量。
四核拉满跑 tun/tap 最大吞吐速度大约在 350Mbps 左右,即双工 160 ~ 170Mbps 下行速度,上传倒是可以爆表达到 190 ~ 200Mbps。
这里是指用多队列模式榨干CPU、并且需要跑AES-256-GCM/CFB这样的加密算法,如果不跑这些会更好一点,可能在 200 ~ 230Mbps 左右。
在这种机子上面 tun/tap 驱动损失的转发效率可能没有那么大,但是一般大约就是五倍的性能差距,反正按着算大体不会差太多。
重点:
1、多队列模式下,可以重复打开相同的 tun/tap 网卡
2、多队列模式下,每个tun/tap 设备句柄会随机收取到内核派发的包
(所以不存在主从这样的接口)
3、多队列模式下,每个 tun/tap 设备句柄可以被 epoll 附加监听读写事件
4、多队列模式下,每个 tun/tap 设备句柄都可以单独设置为 “非阻塞” 或 “阻塞模式”
5、多队列模式下,每个 tun/tap 设备句柄都可以单独被写入IP数据包
每个 tun/tap 设备句柄被单独的 read、write 都涉及到内核加锁的过程,所以如果多线程并行交叉读写这些 tun/tap 设备句柄效率会很低,因为内核会上锁等,所以最好的办法是,一个队列一个 tun/tap io 线程来操作,读写都在同个线程,跨线程会严重影响效率,建议结合 epoll 来用。
每个 tun/tap 设备句柄都应该设置为非阻塞,并且写入不建议用 epoll,直接write向内核写入数据包就行了,同时 tun/tap 驱动在Linux内核,非阻塞只作用在读,写是不存在丢包的,调用一次都会调用到内核驱动的 tun_write 函数,它是无视非阻塞设置的。
源实现:(打开多队列模式的 tun/tap、多队列可以重复打开 tun/tap 句柄)
int TapLinux::OpenDriver(const char* ifrName) noexcept {if (NULL == ifrName || *ifrName == '\x0') {ifrName = "tun%d";}// __oflagint __open_flags = O_RDWR | O_NONBLOCK;
#if defined(O_CLOEXEC)__open_flags |= O_CLOEXEC;
#endifint tun = open("/dev/tun", __open_flags);if (tun == -1) {tun = open("/dev/net/tun", __open_flags);if (tun == -1) {return -1;}}Socket::SetNonblocking(tun, true);ppp::unix__::UnixAfx::set_fd_cloexec(tun);struct ifreq ifr;memset(&ifr, 0, sizeof(ifr));// By default, try to enable tun/tap-driver multi-queue mode, if not single-queue mode.// https://www.kernel.org/doc/Documentation/networking/tuntap.txtstrncpy(ifr.ifr_name, ifrName, IFNAMSIZ);#if defined(IFF_MULTI_QUEUE)ifr.ifr_flags = IFF_TUN | IFF_NO_PI | IFF_MULTI_QUEUE;bool fails = ioctl(tun, TUNSETIFF, &ifr) < 0;if (fails) {ifr.ifr_flags = IFF_TUN | IFF_NO_PI;fails = ioctl(tun, TUNSETIFF, &ifr) < 0;}
#elseifr.ifr_flags = IFF_TUN | IFF_NO_PI;bool fails = ioctl(tun, TUNSETIFF, &ifr) < 0;
#endifif (fails) {::close(tun);return -1;}else {return tun;}}
这篇关于Linux tun/tap 驱动多队列模式(C/C++)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!