epool惊群问题的一个解决方案(利用SO_REUSEPORT)

2023-12-01 23:58

本文主要是介绍epool惊群问题的一个解决方案(利用SO_REUSEPORT),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

    在前段时间公司开发的一个项目中,需要使用多个进程监听同一个端口提高性能,这样的需求需要我们解决惊群问题。

    在早些时候,我们是不能在多个子进程中listen、bind同一个socket端口的。通常的做法会在主进程中对端口进行listen、bind,然后把它同时扔进每个子进程维护的epool池中。
    在这种情况下,当一个客户端请求来到服务端,会导致多个子进程的epool监听同时被唤醒,这就是我们通常所说的epool惊群问题。 在上述背景下,一般有两种情况,虽然不是我们今天文章的主题,也介绍一下。

     无视惊群
    这是lighttpd的解决思路。主要处理流程就是放任每一个子进程的epool监听都被唤醒,然后同时进行accpet()操作。在这种情况下只有一个accept操作会成功(前提是socket被设置为非阻塞),而其他失败的进程则捕获accept抛出的异常。
     避免惊群
    这是nginx的解决思路。具体措施有使用全局互斥锁,每个子进程在epoll_wait()之前先去申请锁,申请到则继续处理,获取不到则等待,并设置了一个负载均衡的算法(当某一个子进程的任务量达到总设置量的7/8时,则不会再尝试去申请锁)来均衡各个进程的任务量。
    这种方案的开发成本会比较高。

     现在来介绍我们的方案,该方案基于Linux kernel 3.9带来了SO_REUSEPORT特性,目的是避免惊群而非无视惊群。
   SO_REUSEPORT特性支持多个进程或者线程绑定到同一端口,提高服务器程序的性能,解决如下问题:允许多个套接字 bind()/listen() 同一个TCP/UDP端口,并且在内核层面实现负载均衡。


    下面我们来看一下相关的代码:
    在子进程中创建socket,并为每个socket增加SO_REUSEPORT属性,bind()/listen()同一个端口

//开辟多进程
for(int f=1;f<=my_config->fork_max;f++)
{if(fork() == 0){//监听主端口int iSvrFd;   struct sockaddr_in sSvrAddr; memset(&sSvrAddr, 0, sizeof(sSvrAddr));   sSvrAddr.sin_family = AF_INET;   sSvrAddr.sin_addr.s_addr = inet_addr("0.0.0.0");     sSvrAddr.sin_port = htons(my_config->socket_port);//创建tcpSocketiSvrFd =socket(AF_INET,SOCK_STREAM,0);//设置为非阻塞int flags = fcntl(iSvrFd,F_GETFL,0); fcntl(iSvrFd,F_SETFL,flags | O_NONBLOCK |SO_REUSEPORT);//绑定监听bind(iSvrFd,(struct sockaddr*)&sSvrAddr,sizeof(sSvrAddr));   listen(iSvrFd,my_config->listen); //创建线程池cthread_pool_manager=boost::shared_ptr(new cthread_pool(my_config));//将指向线程池的智能指针回传进去(必须)cthread_pool_manager->self_ptr=cthread_pool_manager;//初始化线创建程池内的线程cthread_pool_manager->init();//=================================================//初始化epoolerror_report("creating my_epool obj ...\n");boost::shared_ptr my_ep(new my_epool(my_config->epool_events_max));if(!my_ep->flag) error_report(my_ep->error_msg,true);//=================================================//将主端口加入epollmy_ep->add_fd(iSvrFd);//=================================================//监听epollwhile(1){//............}}else{continue;}
}
   现在我们再来看一下程序执行的效果,拿出证据证明上述操作确实避免了惊群问题:
    我们启动一个程序,该程序会创建两个子进程并同时监听9001端口。然后利用telnet向9001进行连接,其中一个子进程唤醒了epool的监听,而另一个没有。
    上面的图已经充分证明,SO_REUSEPORT可以有效地避免惊群问题。我想我们就到这里。

这篇关于epool惊群问题的一个解决方案(利用SO_REUSEPORT)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/443189

相关文章

java实现延迟/超时/定时问题

《java实现延迟/超时/定时问题》:本文主要介绍java实现延迟/超时/定时问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java实现延迟/超时/定时java 每间隔5秒执行一次,一共执行5次然后结束scheduleAtFixedRate 和 schedu

如何解决mmcv无法安装或安装之后报错问题

《如何解决mmcv无法安装或安装之后报错问题》:本文主要介绍如何解决mmcv无法安装或安装之后报错问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录mmcv无法安装或安装之后报错问题1.当我们运行YOwww.chinasem.cnLO时遇到2.找到下图所示这里3.

浅谈配置MMCV环境,解决报错,版本不匹配问题

《浅谈配置MMCV环境,解决报错,版本不匹配问题》:本文主要介绍浅谈配置MMCV环境,解决报错,版本不匹配问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录配置MMCV环境,解决报错,版本不匹配错误示例正确示例总结配置MMCV环境,解决报错,版本不匹配在col

Vue3使用router,params传参为空问题

《Vue3使用router,params传参为空问题》:本文主要介绍Vue3使用router,params传参为空问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录vue3使用China编程router,params传参为空1.使用query方式传参2.使用 Histo

SpringBoot首笔交易慢问题排查与优化方案

《SpringBoot首笔交易慢问题排查与优化方案》在我们的微服务项目中,遇到这样的问题:应用启动后,第一笔交易响应耗时高达4、5秒,而后续请求均能在毫秒级完成,这不仅触发监控告警,也极大影响了用户体... 目录问题背景排查步骤1. 日志分析2. 性能工具定位优化方案:提前预热各种资源1. Flowable

springboot循环依赖问题案例代码及解决办法

《springboot循环依赖问题案例代码及解决办法》在SpringBoot中,如果两个或多个Bean之间存在循环依赖(即BeanA依赖BeanB,而BeanB又依赖BeanA),会导致Spring的... 目录1. 什么是循环依赖?2. 循环依赖的场景案例3. 解决循环依赖的常见方法方法 1:使用 @La

Linux samba共享慢的原因及解决方案

《Linuxsamba共享慢的原因及解决方案》:本文主要介绍Linuxsamba共享慢的原因及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux samba共享慢原因及解决问题表现原因解决办法总结Linandroidux samba共享慢原因及解决

SpringBoot启动报错的11个高频问题排查与解决终极指南

《SpringBoot启动报错的11个高频问题排查与解决终极指南》这篇文章主要为大家详细介绍了SpringBoot启动报错的11个高频问题的排查与解决,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一... 目录1. 依赖冲突:NoSuchMethodError 的终极解法2. Bean注入失败:No qu

找不到Anaconda prompt终端的原因分析及解决方案

《找不到Anacondaprompt终端的原因分析及解决方案》因为anaconda还没有初始化,在安装anaconda的过程中,有一行是否要添加anaconda到菜单目录中,由于没有勾选,导致没有菜... 目录问题原因问http://www.chinasem.cn题解决安装了 Anaconda 却找不到 An

Spring定时任务只执行一次的原因分析与解决方案

《Spring定时任务只执行一次的原因分析与解决方案》在使用Spring的@Scheduled定时任务时,你是否遇到过任务只执行一次,后续不再触发的情况?这种情况可能由多种原因导致,如未启用调度、线程... 目录1. 问题背景2. Spring定时任务的基本用法3. 为什么定时任务只执行一次?3.1 未启用