TCP/IP网络编程之优于select的epoll(一)

2024-04-12 02:18

本文主要是介绍TCP/IP网络编程之优于select的epoll(一),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

epoll的理解及应用

select复用方法由来已久,因此,利用该技术后,无论如何优化程序性能也无法同时接入上百个客户端。这种select方式并不适合以web服务端开发为主流的现代开发环境,所以要学习Linux平台下的epoll。我们先来看TCP/IP网络编程之I/O复用的echo_selectserv.c

echo_selectserv.c

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

#include <stdio.h>

#include <stdlib.h>

#include <string.h>

#include <unistd.h>

#include <arpa/inet.h>

#include <sys/socket.h>

#include <sys/time.h>

#include <sys/select.h>

 

#define BUF_SIZE 100

void error_handling(char *buf);

 

int main(int argc, char *argv[])

{

    int serv_sock, clnt_sock;

    struct sockaddr_in serv_adr, clnt_adr;

    struct timeval timeout;

    fd_set reads, cpy_reads;

 

    socklen_t adr_sz;

    int fd_max, str_len, fd_num, i;

    char buf[BUF_SIZE];

    if (argc != 2) {

        printf("Usage : %s <port>\n", argv[0]);

        exit(1);

    }

 

    serv_sock = socket(PF_INET, SOCK_STREAM, 0);

    memset(&serv_adr, 0, sizeof(serv_adr));

    serv_adr.sin_family = AF_INET;

    serv_adr.sin_addr.s_addr = htonl(INADDR_ANY);

    serv_adr.sin_port = htons(atoi(argv[1]));

 

    if (bind(serv_sock, (struct sockaddr *)&serv_adr, sizeof(serv_adr)) == -1)

        error_handling("bind() error");

    if (listen(serv_sock, 5) == -1)

        error_handling("listen() error");

 

    FD_ZERO(&reads);

    FD_SET(serv_sock, &reads);

    fd_max = serv_sock;

 

    while (1)

    {

        cpy_reads = reads;

        timeout.tv_sec = 5;

        timeout.tv_usec = 5000;

 

        if ((fd_num = select(fd_max + 1, &cpy_reads, 0, 0, &timeout)) == -1)

            break;

        if (fd_num == 0)

            continue;

 

        for (i = 0; i < fd_max + 1; i++)

        {

            if (FD_ISSET(i, &cpy_reads))

            {

                if (i == serv_sock) // connection request!

                {

                    adr_sz = sizeof(clnt_adr);

                    clnt_sock =

                        accept(serv_sock, (struct sockaddr *)&clnt_adr, &adr_sz);

                    FD_SET(clnt_sock, &reads);

                    if (fd_max < clnt_sock)

                        fd_max = clnt_sock;

                    printf("connected client: %d \n", clnt_sock);

                }

                else // read message!

                {

                    str_len = read(i, buf, BUF_SIZE);

                    if (str_len == 0) // close request!

                    {

                        FD_CLR(i, &reads);

                        close(i);

                        printf("closed client: %d \n", i);

                    }

                    else

                    {

                        write(i, buf, str_len); // echo!

                    }

                }

            }

        }

    }

    close(serv_sock);

    return 0;

}

 

void error_handling(char *buf)

{

    fputs(buf, stderr);

    fputc('\n', stderr);

    exit(1);

}

 

基于select的I/O复用技术速度慢的原因

  • 调用select函数后常见的针对所有文件描述符的循环语句
  • 每次调用select函数时都需要向该函数传递监视对象信息

上述两点可以在echo_selectserv.c中的第45、49及54行代码得到确认。调用select函数后,并不是把发生变化的文件描述符单独集中到一起,而是通过观察作为监视对象的fd_set变量的变化,找出发生变化的文件描述符(第54、56行),因此无法避免针对所有监视对象的循环语句。而且,作为监视对象的fd_set变量会发生变化,所以调用select函数前应复制并保存原有信息(第45行),并在每次调用select函数时传递新的监视对象

大家可以想一想,哪些因素是提高性能的障碍?是调用select函数后常见的针对所有文件描述符对象的循环语句?还是每次需要传递的监视对象信息?

只看代码的话很容易认为是循环,但相比循环,更大的障碍是每次传递监视对象信息。因为传递监视对象信息的含义为:每次调用select函数时向操作系统传递监视对象信息。应用程序向操作系统传递数据将对程序造成很大负担,而且无法通过优化代码解决,因此成为性能上的致命弱点

那为何需要把监视对象信息传递给操作系统呢?有些函数不需要操作系统的帮助就能完成的功能,而有些则必须借助操作系统。假设各位定义了四则运算相关函数,此时无需操作系统的帮助。但select函数与文件描述符相关,更准确地说,是监视套接字变化的函数。而套接字是由操作系统管理的,所以select函数绝对需要借助于操作系统才能完成。select函数的这一缺点的弥补方式为:仅仅向操作系统传递一次监视对象,监视范围或内容发生变化时只通知发生变化的事项

这样就无需每次调用select函数时都向操作系统传递监视对象信息,但前提是操作系统支持这种处理方式(每种操作系统支持的程度和方式都存在差异)。Linux的支持方式是epoll,Windows的支持方式是IOCP

知道epoll函数后,可能有人对select函数失望,但大家应该掌握select函数,epoll只在Linux下支持,也就是说改进的I/O复用模型不具兼容性,而大部分操作系统都支持select函数。所以,select具有以下两个优点:

  • 服务端接入者少
  • 程序应具有兼容性

实现epoll时必要的函数和结构体

能够克服select函数缺点的epoll函数具有如下优点,这些优点正好与之前的select函数缺点相反:

  • 无需编写以监视状态变化为目的的针对所有文件描述符的循环语句
  • 调用对应于select函数的epoll_wait函数时无需每次传递监视对象信息

下面介绍epoll服务端实现中需要的三个函数:

  • epoll_create:创建保存epoll文件描述符的空间
  • epoll_ctl:向空间注册并注销文件描述符
  • epoll_wait:与select函数类似,等待文件描述符发生变化

select方式中为了保存监视对象文件描述符,直接声明了fd_set变量。但epoll方式下由操作系统负责保存监视对象文件描述符,因此需要向操作系统请求创建保存文件描述符的空间,此时使用的函数就是epoll_create

此外,为了添加和删除监视对象文件描述符,select方式中需要FD_SET、FD_CLR函数。但在epoll方式中,通过epoll_ctl函数请求操作系统完成。还有,select方式中通过fd_set变量查看监视对象的状态变化(事件发生与否),而epoll中是通过调用epoll_wait函数。还有,select方式中通过fd_set变量查看监视对象的状态变化(事件发生与否),而epoll方式中通过如下结构体epoll_event将发生变化的文件描述符单独集中到一起

1

2

3

4

5

6

7

8

9

10

11

12

struct epoll_event

{

    __uint32_t events; 

    epoll_data_t data;   

};<br>

typedef union epoll_data

{

    void *ptr;

    int fd;

    __uint32_t u32;

    __uint64_t u64;

} epoll_data_t;

  

声明足够大的epoll_event结构体数组后,传递给epoll_wait函数时,发生变化的文件描述符信息将被填入该数组。因此,无需像select函数那样针对所有文件描述符进行循环。以上就是epoll中需要的函数和结构体,实际上,只要有select程序编写的经验,epoll程序的编写就不难。接下来给出这些函数的详细说明

epoll是从Linux2.5.44版内核开始引入的,所以使用epoll前需要先检查Linux内核版本。若有人怀疑自己Linux版本过低,可通过如下命令验证

1

2

# cat /proc/sys/kernel/osrelease

3.10.0-693.21.1.el7.x86_64

  

epoll_create

1

2

#include <sys/epoll.h>

int epoll_create(int size);//成功时返回epoll文件描述符,失败时返回-1

  

  •  size:epoll实例的大小

调用epoll_create函数时创建的文件描述符保存空间称为“epoll例程”,但有些情况下名称不同,需要稍加注意。通过参数size传递的值决定epoll例程的大小,但该值只是向操作系统提的建议,换言之,size并非决定epoll例程的大小,而是仅供操作系统参考

epoll_create函数创建的资源与套接字相同,也由操作系统管理。因此,该函数和创建套接字对的情况相同,也会返回文件描述符。也就是说,该函数返回的文件描述符主要用于区分epoll例程。需要终止时,与其他文件描述符相同,也要调用close函数

epoll_ctl

1

2

#include <sys/epoll.h>

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

  

  • epfd:用于注册监视对象的epoll例程的文件描述符
  • op:用于指定监视对象的添加、删除或更改等操作
  • fd:需要注册的监视对象文件描述符
  • event:监视对象的事件类型

与其他epoll函数相比,该函数有些复杂,但通过调用语句就很容易理解。假设按照如下形式调用epoll_ctl函数:

1

epoll_ctl(A, EPOLL_CTL_ADD, B, C);

  

第二个参数EPOLL_CTL_ADD意味着“添加”,因此上述语句的含义是:epoll例程A中注册文件描述符B,主要目的是监视参数C中的事件

再介绍一个调用语句:

1

epoll_ctl(A, EPOLL_CTL_DEL, B, NULL);

  

上述语句中第二个参数EPOLL_CTL_DEL指“删除”,因此该语句的含义为:从epoll例程A中删除文件描述符B

从上述调用语句中可以看到,从监视对象中删除时,不需要监视类型(事件信息),因此向第四个参数传递NULL。接下来介绍epoll_ctl第二个参数传递的常量及含义:

  • EPOLL_CTL_ADD:将文件描述符注册到epoll例程
  • EPOLL_CTL_DEL:从epoll例程中删除文件描述符
  • EPOLL_CTL_MOD:更改注册的文件描述符的关注事件发生情况

如前所示,向epoll_ctl的第二个参数传递EPOLL_CTL_DEL时,应同时向第四个参数传递NULL。但Linux2.6.9之前的内核不允许传递NULL。虽然被忽略掉,但也应传递epoll_event结构体变量的地址值。其实这是BUG,但也没必要因此怀疑epoll的功能,因为我们使用的标准函数中也存在BUG

下面讲解epoll_ctl函数的第四个参数,其类型是之前讲过的epoll_event结构体指针。如前所述,epoll_event结构体用于保存发生事件的文件描述符集合。但也可以在epoll例程中注册文件描述符时,用于注册关注的事件。函数中epoll_event结构体的定义并不显眼,因此通过调用语句说明该结构体在epoll_ctl函数中的应用

1

2

3

4

5

6

struct epoll_event event;

……

event.events=EPOLLIN;//发生需要读取数据的情况(事件)时

event.data.fd=sockfd;

epoll_ctl(epfd, EPOLL_CTL_ADD, sockfd, &event);

……

  

上述代码将sockfd注册到epoll例程epfd中,并在需要读取数据的情况下产生相应事件。接下来给出epoll_event的成员events中可以保存的常量及所指的事件类型

  • EPOLLIN:需要读取数据的情况
  • EPOLLOUT:输出缓冲为空,可以立即发送数据的情况
  • EPOLLPRI:收到OOB数据的情况
  • EPOLLRDHUP:断开连接或半关闭的情况,这在边缘触发方式下非常有用
  • EPOLLERR:发生错误的情况
  • EPOLLET:以边缘触发的方式得到事件通知
  • EPOLLONESHOT:发生一次事件后,相应文件描述符不再收到事件通知。因此需要向epoll_ctl函数的第二个参数传递EPOLL_CTL_MOD,再次设置事件

epoll_wait

1

2

#include <sys/epoll.h>

int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);//成功时返回发生事件的文件描述符,失败时返回-1

  

  • epfd:表示事件发生监视范围的epoll例程的文件描述符
  • events:保存发生事件的文件描述符集合的结构体地址值
  • maxevents:第二个参数中可以保存的最大事件数
  • timeout:以1/1000秒为单位的等待时间,传递-1时,一直等待直到发生事件

该函数的调用方式如下,需要注意的是,第二个参数所指缓冲需要动态分配

1

2

3

4

5

6

7

int event_cnt;

struct epoll_event * ep_events;

……

ep_events = malloc(sizeof(struct epoll_event)*EPOLL_SIZE);//EPOLL_SIZE是宏常量

……

event_cnt = epoll_wait(epfd, ep_events, EPOLL_SIZE, -1);

……

  

调用函数后,返回发生事件的文件描述符,同时在第二个参数指向的缓冲中保存发生事件的文件描述符集合。因此,无需像select那样插入针对所有文件描述符的循环

https://www.cnblogs.com/beiluowuzheng/p/9695789.html

这篇关于TCP/IP网络编程之优于select的epoll(一)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/895830

相关文章

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

ASIO网络调试助手之一:简介

多年前,写过几篇《Boost.Asio C++网络编程》的学习文章,一直没机会实践。最近项目中用到了Asio,于是抽空写了个网络调试助手。 开发环境: Win10 Qt5.12.6 + Asio(standalone) + spdlog 支持协议: UDP + TCP Client + TCP Server 独立的Asio(http://www.think-async.com)只包含了头文件,不依

poj 3181 网络流,建图。

题意: 农夫约翰为他的牛准备了F种食物和D种饮料。 每头牛都有各自喜欢的食物和饮料,而每种食物和饮料都只能分配给一头牛。 问最多能有多少头牛可以同时得到喜欢的食物和饮料。 解析: 由于要同时得到喜欢的食物和饮料,所以网络流建图的时候要把牛拆点了。 如下建图: s -> 食物 -> 牛1 -> 牛2 -> 饮料 -> t 所以分配一下点: s  =  0, 牛1= 1~

poj 3068 有流量限制的最小费用网络流

题意: m条有向边连接了n个仓库,每条边都有一定费用。 将两种危险品从0运到n-1,除了起点和终点外,危险品不能放在一起,也不能走相同的路径。 求最小的费用是多少。 解析: 抽象出一个源点s一个汇点t,源点与0相连,费用为0,容量为2。 汇点与n - 1相连,费用为0,容量为2。 每条边之间也相连,费用为每条边的费用,容量为1。 建图完毕之后,求一条流量为2的最小费用流就行了

poj 2112 网络流+二分

题意: k台挤奶机,c头牛,每台挤奶机可以挤m头牛。 现在给出每只牛到挤奶机的距离矩阵,求最小化牛的最大路程。 解析: 最大值最小化,最小值最大化,用二分来做。 先求出两点之间的最短距离。 然后二分匹配牛到挤奶机的最大路程,匹配中的判断是在这个最大路程下,是否牛的数量达到c只。 如何求牛的数量呢,用网络流来做。 从源点到牛引一条容量为1的边,然后挤奶机到汇点引一条容量为m的边

【编程底层思考】垃圾收集机制,GC算法,垃圾收集器类型概述

Java的垃圾收集(Garbage Collection,GC)机制是Java语言的一大特色,它负责自动管理内存的回收,释放不再使用的对象所占用的内存。以下是对Java垃圾收集机制的详细介绍: 一、垃圾收集机制概述: 对象存活判断:垃圾收集器定期检查堆内存中的对象,判断哪些对象是“垃圾”,即不再被任何引用链直接或间接引用的对象。内存回收:将判断为垃圾的对象占用的内存进行回收,以便重新使用。

Go Playground 在线编程环境

For all examples in this and the next chapter, we will use Go Playground. Go Playground represents a web service that can run programs written in Go. It can be opened in a web browser using the follow

深入理解RxJava:响应式编程的现代方式

在当今的软件开发世界中,异步编程和事件驱动的架构变得越来越重要。RxJava,作为响应式编程(Reactive Programming)的一个流行库,为Java和Android开发者提供了一种强大的方式来处理异步任务和事件流。本文将深入探讨RxJava的核心概念、优势以及如何在实际项目中应用它。 文章目录 💯 什么是RxJava?💯 响应式编程的优势💯 RxJava的核心概念

函数式编程思想

我们经常会用到各种各样的编程思想,例如面向过程、面向对象。不过笔者在该博客简单介绍一下函数式编程思想. 如果对函数式编程思想进行概括,就是f(x) = na(x) , y=uf(x)…至于其他的编程思想,可能是y=a(x)+b(x)+c(x)…,也有可能是y=f(x)=f(x)/a + f(x)/b+f(x)/c… 面向过程的指令式编程 面向过程,简单理解就是y=a(x)+b(x)+c(x)