epool惊群问题的一个解决方案(利用SO_REUSEPORT)

2023-12-01 23:58

本文主要是介绍epool惊群问题的一个解决方案(利用SO_REUSEPORT),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

    在前段时间公司开发的一个项目中,需要使用多个进程监听同一个端口提高性能,这样的需求需要我们解决惊群问题。

    在早些时候,我们是不能在多个子进程中listen、bind同一个socket端口的。通常的做法会在主进程中对端口进行listen、bind,然后把它同时扔进每个子进程维护的epool池中。
    在这种情况下,当一个客户端请求来到服务端,会导致多个子进程的epool监听同时被唤醒,这就是我们通常所说的epool惊群问题。 在上述背景下,一般有两种情况,虽然不是我们今天文章的主题,也介绍一下。

     无视惊群
    这是lighttpd的解决思路。主要处理流程就是放任每一个子进程的epool监听都被唤醒,然后同时进行accpet()操作。在这种情况下只有一个accept操作会成功(前提是socket被设置为非阻塞),而其他失败的进程则捕获accept抛出的异常。
     避免惊群
    这是nginx的解决思路。具体措施有使用全局互斥锁,每个子进程在epoll_wait()之前先去申请锁,申请到则继续处理,获取不到则等待,并设置了一个负载均衡的算法(当某一个子进程的任务量达到总设置量的7/8时,则不会再尝试去申请锁)来均衡各个进程的任务量。
    这种方案的开发成本会比较高。

     现在来介绍我们的方案,该方案基于Linux kernel 3.9带来了SO_REUSEPORT特性,目的是避免惊群而非无视惊群。
   SO_REUSEPORT特性支持多个进程或者线程绑定到同一端口,提高服务器程序的性能,解决如下问题:允许多个套接字 bind()/listen() 同一个TCP/UDP端口,并且在内核层面实现负载均衡。


    下面我们来看一下相关的代码:
    在子进程中创建socket,并为每个socket增加SO_REUSEPORT属性,bind()/listen()同一个端口

//开辟多进程
for(int f=1;f<=my_config->fork_max;f++)
{if(fork() == 0){//监听主端口int iSvrFd;   struct sockaddr_in sSvrAddr; memset(&sSvrAddr, 0, sizeof(sSvrAddr));   sSvrAddr.sin_family = AF_INET;   sSvrAddr.sin_addr.s_addr = inet_addr("0.0.0.0");     sSvrAddr.sin_port = htons(my_config->socket_port);//创建tcpSocketiSvrFd =socket(AF_INET,SOCK_STREAM,0);//设置为非阻塞int flags = fcntl(iSvrFd,F_GETFL,0); fcntl(iSvrFd,F_SETFL,flags | O_NONBLOCK |SO_REUSEPORT);//绑定监听bind(iSvrFd,(struct sockaddr*)&sSvrAddr,sizeof(sSvrAddr));   listen(iSvrFd,my_config->listen); //创建线程池cthread_pool_manager=boost::shared_ptr(new cthread_pool(my_config));//将指向线程池的智能指针回传进去(必须)cthread_pool_manager->self_ptr=cthread_pool_manager;//初始化线创建程池内的线程cthread_pool_manager->init();//=================================================//初始化epoolerror_report("creating my_epool obj ...\n");boost::shared_ptr my_ep(new my_epool(my_config->epool_events_max));if(!my_ep->flag) error_report(my_ep->error_msg,true);//=================================================//将主端口加入epollmy_ep->add_fd(iSvrFd);//=================================================//监听epollwhile(1){//............}}else{continue;}
}
   现在我们再来看一下程序执行的效果,拿出证据证明上述操作确实避免了惊群问题:
    我们启动一个程序,该程序会创建两个子进程并同时监听9001端口。然后利用telnet向9001进行连接,其中一个子进程唤醒了epool的监听,而另一个没有。
    上面的图已经充分证明,SO_REUSEPORT可以有效地避免惊群问题。我想我们就到这里。

这篇关于epool惊群问题的一个解决方案(利用SO_REUSEPORT)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/443189

相关文章

Redis连接失败:客户端IP不在白名单中的问题分析与解决方案

《Redis连接失败:客户端IP不在白名单中的问题分析与解决方案》在现代分布式系统中,Redis作为一种高性能的内存数据库,被广泛应用于缓存、消息队列、会话存储等场景,然而,在实际使用过程中,我们可能... 目录一、问题背景二、错误分析1. 错误信息解读2. 根本原因三、解决方案1. 将客户端IP添加到Re

详谈redis跟数据库的数据同步问题

《详谈redis跟数据库的数据同步问题》文章讨论了在Redis和数据库数据一致性问题上的解决方案,主要比较了先更新Redis缓存再更新数据库和先更新数据库再更新Redis缓存两种方案,文章指出,删除R... 目录一、Redis 数据库数据一致性的解决方案1.1、更新Redis缓存、删除Redis缓存的区别二

oracle数据库索引失效的问题及解决

《oracle数据库索引失效的问题及解决》本文总结了在Oracle数据库中索引失效的一些常见场景,包括使用isnull、isnotnull、!=、、、函数处理、like前置%查询以及范围索引和等值索引... 目录oracle数据库索引失效问题场景环境索引失效情况及验证结论一结论二结论三结论四结论五总结ora

element-ui下拉输入框+resetFields无法回显的问题解决

《element-ui下拉输入框+resetFields无法回显的问题解决》本文主要介绍了在使用ElementUI的下拉输入框时,点击重置按钮后输入框无法回显数据的问题,具有一定的参考价值,感兴趣的... 目录描述原因问题重现解决方案方法一方法二总结描述第一次进入页面,不做任何操作,点击重置按钮,再进行下

python 字典d[k]中key不存在的解决方案

《python字典d[k]中key不存在的解决方案》本文主要介绍了在Python中处理字典键不存在时获取默认值的两种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录defaultdict:处理找不到的键的一个选择特殊方法__missing__有时候为了方便起见,

解决mybatis-plus-boot-starter与mybatis-spring-boot-starter的错误问题

《解决mybatis-plus-boot-starter与mybatis-spring-boot-starter的错误问题》本文主要讲述了在使用MyBatis和MyBatis-Plus时遇到的绑定异常... 目录myBATis-plus-boot-starpythonter与mybatis-spring-b

mysql主从及遇到的问题解决

《mysql主从及遇到的问题解决》本文详细介绍了如何使用Docker配置MySQL主从复制,首先创建了两个文件夹并分别配置了`my.cnf`文件,通过执行脚本启动容器并配置好主从关系,文中还提到了一些... 目录mysql主从及遇到问题解决遇到的问题说明总结mysql主从及遇到问题解决1.基于mysql

如何测试计算机的内存是否存在问题? 判断电脑内存故障的多种方法

《如何测试计算机的内存是否存在问题?判断电脑内存故障的多种方法》内存是电脑中非常重要的组件之一,如果内存出现故障,可能会导致电脑出现各种问题,如蓝屏、死机、程序崩溃等,如何判断内存是否出现故障呢?下... 如果你的电脑是崩溃、冻结还是不稳定,那么它的内存可能有问题。要进行检查,你可以使用Windows 11

如何安装HWE内核? Ubuntu安装hwe内核解决硬件太新的问题

《如何安装HWE内核?Ubuntu安装hwe内核解决硬件太新的问题》今天的主角就是hwe内核(hardwareenablementkernel),一般安装的Ubuntu都是初始内核,不能很好地支... 对于追求系统稳定性,又想充分利用最新硬件特性的 Ubuntu 用户来说,HWEXBQgUbdlna(Har

Linux限制ip访问的解决方案

《Linux限制ip访问的解决方案》为了修复安全扫描中发现的漏洞,我们需要对某些服务设置访问限制,具体来说,就是要确保只有指定的内部IP地址能够访问这些服务,所以本文给大家介绍了Linux限制ip访问... 目录背景:解决方案:使用Firewalld防火墙规则验证方法深度了解防火墙逻辑应用场景与扩展背景: