socket编程之常用api介绍与socket、select、poll、epoll高并发服务器模型代码实现

Home / Article MrLee 6月前 206

本文旨在学习socket网络编程这一块的内容,epoll是重中之重,后续文章写reactor模型是建立在epoll之上的。

本专栏知识点是通过零声教育的线上课学习,进行梳理总结写下文章,对c/c++linux课程感兴趣的读者,可以点击链接 C/C++后台高级服务器课程介绍 详细查看课程的服务。

socket编程

socket介绍

传统的进程间通信借助内核提供的IPC机制进行, 但是只能限于本机通信, 若要跨机通信, 就必须使用网络通信( 本质上借助内核-内核提供了socket伪文件的机制实现通信----实际上是使用文件描述符), 这就需要用到内核提供给用户的socket API函数库。

使用socket会建立一个socket pair,如下图, 一个文件描述符操作两个缓冲区。

使用socket的API函数编写服务端和客户端程序的步骤

预备知识

网络字节序

网络字节序:大端和小端的概念

大端: 低位地址存放高位数据, 高位地址存放低位数据

小端: 低位地址存放低位数据, 高位地址存放高位数据

大端和小端的使用使用场合:在网络中经常需要考虑大端和小端的是IP和端口。网络传输用的是大端,计算机用的是小端, 所以需要进行大小端的转换

下面4个函数就是进行大小端转换的函数,函数名的h表示主机host, n表示网络network, s表示short, l表示long。

#include <arpa/inet.h>
uint32_t htonl(uint32_t hostlong);
uint16_t htons(uint16_t hostshort);
uint32_t ntohl(uint32_t netlong);
uint16_t ntohs(uint16_t netshort);

上述的几个函数, 如果本来不需要转换函数内部就不会做转换。

IP地址转换函数

IP地址转换函数

int inet_pton(int af, const char *src, void *dst);

p->表示点分十进制的字符串形式

to->到

n->表示network网络

函数说明: 将字符串形式的点分十进制IP转换为大端模式的网络IP(整形4字节数)

参数说明:

af: AF_INET

src: 字符串形式的点分十进制的IP地址

dst: 存放转换后的变量的地址

例如inet_pton(AF_INET, "127.0.0.1", &serv.sin_addr.s_addr);

手工也可以计算: 如192.168.232.145, 先将4个正数分别转换为16进制数,

192—>0xC0 168—>0xA8 232—>0xE8 145—>0x91

最后按照大端字节序存放: 0x91E8A8C0, 这个就是4字节的整形值。

const char *inet_ntop(int af, const void *src, char *dst, socklen_t size);

函数说明: 网络IP转换为字符串形式的点分十进制的IP

参数说明:

af: AF_INET

src: 网络的整形的IP地址

dst: 转换后的IP地址,一般为字符串数组

size: dst的长度

返回值:

成功–返回执行dst的指针

失败–返回NULL, 并设置errno

例如: IP地址为010aa8c0, 转换为点分十进制的格式:

01---->1 0a---->10 a8---->168 c0---->192

由于从网络中的IP地址是高端模式, 所以转换为点分十进制后应该为: 192.168.10.1

struct sockaddr

socket编程用到的重要的结构体:struct sockaddr

//struct sockaddr结构说明:

struct sockaddr {

     sa_family_t sa_family;

     char     sa_data[14];

}

//struct sockaddr_in结构:

struct sockaddr_in {

     sa_family_t    sin_family; /* address family: AF_INET */

     in_port_t      sin_port;   /* port in network byte order */

     struct in_addr sin_addr;   /* internet address */

};

/* Internet address. */

struct in_addr {

      uint32_t  s_addr;     /* address in network byte order */

}; //网络字节序IP--大端模式

通过man 7 ip可以查看相关说明

主要API函数介绍

socket

int socket(int domain, int type, int protocol);

函数描述: 创建socket

参数说明:

domain: 协议版本

- - AF_INET IPV4

- - AF_INET6 IPV6

- - AF_UNIX AF_LOCAL本地套接字使用

type:协议类型

- - SOCK_STREAM 流式, 默认使用的协议是TCP协议

- - SOCK_DGRAM  报式, 默认使用的是UDP协议

protocal:

- - 一般填0, 表示使用对应类型的默认协议.

返回值:

- - 成功: 返回一个大于0的文件描述符

- - 失败: 返回-1, 并设置errno

当调用socket函数以后, 返回一个文件描述符, 内核会提供与该文件描述符相对应的读和写缓冲区,同时还有两个队列, 分别是请求连接队列和已连接队列(监听文件描述符才有,listenFd)

bind

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen); 

函数描述: 将socket文件描述符和IP,PORT绑定

参数说明:

socket: 调用socket函数返回的文件描述符

addr: 本地服务器的IP地址和PORT,

struct sockaddr_in serv;

serv.sin_family = AF_INET;

serv.sin_port = htons(8888);

//serv.sin_addr.s_addr = htonl(INADDR_ANY);

//INADDR_ANY: 表示使用本机任意有效的可用IP

inet_pton(AF_INET, "127.0.0.1", &serv.sin_addr.s_addr);

addrlen: addr变量的占用的内存大小

返回值:

成功: 返回0

失败: 返回-1, 并设置errno

listen

int listen(int sockfd, int backlog);

函数描述: 将套接字由主动态变为被动态

参数说明:

sockfd: 调用socket函数返回的文件描述符

backlog: 在linux系统中,这里代表全连接队列(已连接队列)的数量。在unix系统种,这里代表全连接队列(已连接队列)+ 半连接队列(请求连接队列)的总数

返回值:

成功: 返回0

失败: 返回-1, 并设置errno

accept

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

函数说明:获得一个连接, 若当前没有连接则会阻塞等待.

函数参数:

sockfd: 调用socket函数返回的文件描述符

addr: 传出参数, 保存客户端的地址信息

addrlen: 传入传出参数, addr变量所占内存空间大小

返回值:

成功: 返回一个新的文件描述符,用于和客户端通信

失败: 返回-1, 并设置errno值.

accept函数是一个阻塞函数, 若没有新的连接请求, 则一直阻塞.

从已连接队列中获取一个新的连接, 并获得一个新的文件描述符, 该文件描述符用于和客户端通信. (内核会负责将请求队列中的连接拿到已连接队列中)

connect

int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

函数说明: 连接服务器

函数参数:

sockfd: 调用socket函数返回的文件描述符

addr: 服务端的地址信息

addrlen: addr变量的内存大小

返回值:

成功: 返回0

失败: 返回-1, 并设置errno值

读取和发送数据

接下来就可以使用write和read函数进行读写操作了。除了使用read/write函数以外, 还可以使用recv和send函数。

ssize_t read(int fd, void *buf, size_t count);

ssize_t write(int fd, const void *buf, size_t count);

ssize_t recv(int sockfd, void *buf, size_t len, int flags);

ssize_t send(int sockfd, const void *buf, size_t len, int flags);

//对应recv和send这两个函数flags直接填0就可以了

注意: 如果写缓冲区已满, write也会阻塞, read读操作的时候, 若读缓冲区没有数据会引起阻塞。

高并发服务器模型-select

select介绍

多路IO技术: select, 同时监听多个文件描述符, 将监控的操作交给内核去处理

int select(int nfds, fd_set * readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);

数据类型fd_set::文件描述符集合——本质是位图

函数介绍: 委托内核监控该文件描述符对应的读,写或者错误事件的发生

参数说明:

nfds: 最大的文件描述符+1

readfds: 读集合, 是一个传入传出参数

传入: 指的是告诉内核哪些文件描述符需要监控

传出: 指的是内核告诉应用程序哪些文件描述符发生了变化

writefds: 写文件描述符集合(传入传出参数,同上)

execptfds: 异常文件描述符集合(传入传出参数,同上)

timeout:

NULL--表示永久阻塞, 直到有事件发生

0   --表示不阻塞, 立刻返回, 不管是否有监控的事件发生

>0  --到指定事件或者有事件发生了就返回

返回值: 成功返回发生变化的文件描述符的个数。失败返回-1, 并设置errno值。

select-api

将fd从set集合中清除

void FD_CLR(int fd, fd_set *set);

功能描述: 判断fd是否在集合中

返回值: 如果fd在set集合中, 返回1, 否则返回0

int FD_ISSET(int fd, fd_set *set);

将fd设置到set集合中

void FD_SET(int fd, fd_set *set);

初始化set集合

void FD_ZERO(fd_set *set);

用select函数其实就是委托内核帮我们去检测哪些文件描述符有可读数据,可写,错误发生

int select(int nfds, fd_set * readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);

select优缺点

select优点:

select支持跨平台

select缺点:

代码编写困难

会涉及到用户区到内核区的来回拷贝

当客户端多个连接, 但少数活跃的情况, select效率较低(例如: 作为极端的一种情况, 3-1023文件描述符全部打开, 但是只有1023有发送数据, select就显得效率低下)

最大支持1024个客户端连接(select最大支持1024个客户端连接不是有文件描述符表最多可以支持1024个文件描述符限制的, 而是由FD_SETSIZE=1024限制的)

FD_SETSIZE=1024 fd_set使用了该宏, 当然可以修改内核, 然后再重新编译内核, 一般不建议这么做

select代码实现

#include <errno.h>

#include <netinet/in.h>

#include <stdio.h>

#include <stdlib.h>

#include <string.h>

#include <sys/socket.h>

#include <sys/types.h>

#include <unistd.h>

#include <sys/poll.h>

#include <sys/epoll.h>

#include <pthread.h>

#define MAX_LEN  4096

int main(int argc, char **argv) {

    int listenfd, connfd, n;

    struct sockaddr_in svr_addr;

    char buff[MAX_LEN];

    if ((listenfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {

        printf("create socket error: %s(errno: %d)\n", strerror(errno), errno);

        return 0;

    }

    memset(&svr_addr, 0, sizeof(svr_addr));

    svr_addr.sin_family = AF_INET;

    svr_addr.sin_addr.s_addr = htonl(INADDR_ANY);

    svr_addr.sin_port = htons(8081);

    if (bind(listenfd, (struct sockaddr *) &svr_addr, sizeof(svr_addr)) == -1) {

        printf("bind socket error: %s(errno: %d)\n", strerror(errno), errno);

        return 0;

    }

    if (listen(listenfd, 10) == -1) {

        printf("listen socket error: %s(errno: %d)\n", strerror(errno), errno);

        return 0;

    }

    //select

    fd_set rfds, rset, wfds, wset;

    FD_ZERO(&rfds);

    FD_ZERO(&wfds);

    FD_SET(listenfd, &rfds);

    int max_fd = listenfd;

    while (1) {

        rset = rfds;

        wset = wfds;

        int nready = select(max_fd + 1, &rset, &wset, NULL, NULL);

        if (FD_ISSET(listenfd, &rset)) { //

            struct sockaddr_in clt_addr;

            socklen_t len = sizeof(clt_addr);

            if ((connfd = accept(listenfd, (struct sockaddr *) &clt_addr, &len)) == -1) {

                printf("accept socket error: %s(errno: %d)\n", strerror(errno), errno);

                return 0;

            }

            FD_SET(connfd, &rfds);

            if (connfd > max_fd) max_fd = connfd;

            if (--nready == 0) continue;

        }

        int i = 0;

        for (i = listenfd + 1; i <= max_fd; i++) {

            if (FD_ISSET(i, &rset)) { //

                n = recv(i, buff, MAX_LEN, 0);

                if (n > 0) {

                    buff[n] = '\0';

                    printf("recv msg from client: %s\n", buff);

                    FD_SET(i, &wfds);

                }

                else if (n == 0) { //

                    FD_CLR(i, &rfds);

                    close(i);

                }

                if (--nready == 0) break;

            }

            else if (FD_ISSET(i, &wset)) {

                send(i, buff, n, 0);

                FD_SET(i, &rfds);

                FD_CLR(i, &wfds);

            }

        }

    }

    close(listenfd);

    return 0;

}

高并发服务器模型-poll

poll介绍

poll跟select类似, 监控多路IO, 但poll不能跨平台。其实poll就是把select三个文件描述符集合变成一个集合了。

int poll(struct pollfd *fds, nfds_t nfds, int timeout);

参数说明:

fds: 传入传出参数, 实际上是一个结构体数组

fds.fd: 要监控的文件描述符

fds.events: 

POLLIN---->读事件

POLLOUT---->写事件

fds.revents: 返回的事件

nfds: 数组实际有效内容的个数

timeout: 超时时间, 单位是毫秒.

-1:永久阻塞, 直到监控的事件发生

0: 不管是否有事件发生, 立刻返回

>0: 直到监控的事件发生或者超时

返回值:

成功:返回就绪事件的个数

失败: 返回-1。若timeout=0, poll函数不阻塞,且没有事件发生, 此时返回-1, 并且errno=EAGAIN, 这种情况不应视为错误。

struct pollfd {

   int   fd;        /* file descriptor */   监控的文件描述符

   short events;     /* requested events */  要监控的事件---不会被修改

   short revents;    /* returned events */   返回发生变化的事件 ---由内核返回

};

说明:

当poll函数返回的时候, 结构体当中的fd和events没有发生变化, 究竟有没有事件发生由revents来判断, 所以poll是请求和返回分离

struct pollfd结构体中的fd成员若赋值为-1, 则poll不会监控

3.相对于select, poll没有本质上的改变; 但是poll可以突破1024的限制.在/proc/sys/fs/file-max查看一个进程可以打开的socket描述符上限,如果需要可以修改配置文件: /etc/security/limits.conf,加入如下配置信息, 然后重启终端即可生效

soft nofile 1024

* hard nofile 100000

soft和hard分别表示ulimit命令可以修改的最小限制和最大限制

poll代码实现

#include <errno.h>

#include <netinet/in.h>

#include <stdio.h>

#include <stdlib.h>

#include <string.h>

#include <sys/socket.h>

#include <sys/types.h>

#include <unistd.h>

#include <sys/poll.h>

#include <sys/epoll.h>

#include <pthread.h>

#define MAX_LEN  4096

#define POLL_SIZE    1024

int main(int argc, char **argv) {

    int listenfd, connfd, n;

    struct sockaddr_in svr_addr;

    char buff[MAX_LEN];

    if ((listenfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {

        printf("create socket error: %s(errno: %d)\n", strerror(errno), errno);

        return 0;

    }

    memset(&svr_addr, 0, sizeof(svr_addr));

    svr_addr.sin_family = AF_INET;

    svr_addr.sin_addr.s_addr = htonl(INADDR_ANY);

    svr_addr.sin_port = htons(8081);

    if (bind(listenfd, (struct sockaddr *) &svr_addr, sizeof(svr_addr)) == -1) {

        printf("bind socket error: %s(errno: %d)\n", strerror(errno), errno);

        return 0;

    }

    if (listen(listenfd, 10) == -1) {

        printf("listen socket error: %s(errno: %d)\n", strerror(errno), errno);

        return 0;

    }

    //poll

    struct pollfd fds[POLL_SIZE] = {0};

    fds[0].fd = listenfd;

    fds[0].events = POLLIN;

    int max_fd = listenfd;

    int i = 0;

    for (i = 1; i < POLL_SIZE; i++) {

        fds[i].fd = -1;

    }

    while (1) {

        int nready = poll(fds, max_fd + 1, -1);

        if (fds[0].revents & POLLIN) {

            struct sockaddr_in client = {};

            socklen_t len = sizeof(client);

            if ((connfd = accept(listenfd, (struct sockaddr *) &client, &len)) == -1) {

                printf("accept socket error: %s(errno: %d)\n", strerror(errno), errno);

                return 0;

            }

            printf("accept \n");

            fds[connfd].fd = connfd;

            fds[connfd].events = POLLIN;

            if (connfd > max_fd) max_fd = connfd;

            if (--nready == 0) continue;

        }

        //int i = 0;

        for (i = listenfd + 1; i <= max_fd; i++) {

            if (fds[i].revents & POLLIN) {

                n = recv(i, buff, MAX_LEN, 0);

                if (n > 0) {

                    buff[n] = '\0';

                    printf("recv msg from client: %s\n", buff);

                    send(i, buff, n, 0);

                }

                else if (n == 0) { //

                    fds[i].fd = -1;

                    close(i);

                }

                if (--nready == 0) break;

            }

        }

    }

}

高并发服务器模型-epoll (重点)

epoll介绍

将检测文件描述符的变化委托给内核去处理, 然后内核将发生变化的文件描述符对应的事件返回给应用程序。

记住,epoll是事件驱动的,其底层数据结构是红黑树,红黑树的key是fd,val是事件,返回的是事件。

epoll有两种工作模式,ET和LT模式。

水平触发LT:

高电平代表1

只要缓冲区中有数据, 就一直通知

边缘触发ET:

电平有变化就代表1

缓冲区中有数据只会通知一次, 之后再有新的数据到来才会通知(若是读数据的时候没有读完, 则剩余的数据不会再通知, 直到有新的数据到来)

epoll默认是水平触发LT,在需要高性能的场景下,可以改成边缘ET非阻塞方式来提高效率。

一般使用LT是一次性读数据读不完,数据较多的情况。而一次性能够读完,小数据量则用边缘ET。

ET模式由于只通知一次, 所以在读的时候要循环读, 直到读完, 但是当读完之后read就会阻塞, 所以应该将该文件描述符设置为非阻塞模式(fcntl函数)

read函数在非阻塞模式下读的时候, 若返回-1, 且errno为EAGAIN, 则表示当前资源不可用, 也就是说缓冲区无数据(缓冲区的数据已经读完了); 或者当read返回的读到的数据长度小于请求的数据长度时,就可以确定此时缓冲区中已没有数据可读了,也就可以认为此时读事件已处理完成。

epoll反应堆

反应堆: 一个小事件触发一系列反应

epoll反应堆的思想: c++的封装思想(把数据和操作封装到一起)

将描述符,事件,对应的处理方法封装在一起

当描述符对应的事件发生了, 自动调用处理方法(其实原理就是回调函数)

poll反应堆的核心思想是: 在调用epoll_ctl函数的时候, 将events上树的时候,利用epoll_data_t的ptr成员, 将一个文件描述符,事件和回调函数封装成一个结构体, 然后让ptr指向这个结构体。然后调用epoll_wait函数返回的时候, 可以得到具体的events, 然后获得events结构体中的events.data.ptr指针, ptr指针指向的结构体中有回调函数, 最终可以调用这个回调函数。

struct epoll_event {

uint32_t     events;      /* Epoll events */

epoll_data_t data;        /* User data variable */

};

typedef union epoll_data {

void        *ptr;

int          fd;

uint32_t     u32;

uint64_t     u64;

} epoll_data_t;

epoll-api

int epoll_create(int size);

函数说明: 创建一个树根

参数说明:

size: 最大节点数, 此参数在linux 2.6.8已被忽略, 但必须传递一个大于0的数,历史意义,用epoll_create1也行。

返回值:

成功: 返回一个大于0的文件描述符, 代表整个树的树根.

失败: 返回-1, 并设置errno值.

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);

函数说明: 将要监听的节点在epoll树上添加, 删除和修改

参数说明:

epfd: epoll树根

op:

EPOLL_CTL_ADD: 添加事件节点到树上

EPOLL_CTL_DEL: 从树上删除事件节点

EPOLL_CTL_MOD: 修改树上对应的事件节点

fd: 事件节点对应的文件描述符

event: 要操作的事件节点

struct epoll_event {

uint32_t     events;      /* Epoll events */

epoll_data_t data;        /* User data variable */

};

typedef union epoll_data {

void        *ptr;

int          fd;

uint32_t     u32;

uint64_t     u64;

} epoll_data_t;

event.events常用的有:

EPOLLIN: 读事件

EPOLLOUT: 写事件

EPOLLERR: 错误事件

EPOLLET: 边缘触发模式

event.fd: 要监控的事件对应的文件描述符

int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);

函数说明:等待内核返回事件发生

参数说明:

epfd: epoll树根

events: 传出参数, 其实是一个事件结构体数组

maxevents: 数组大小

timeout:

-1: 表示永久阻塞

0: 立即返回

>0: 表示超时等待事件

返回值:

成功: 返回发生事件的个数

失败: 若timeout=0, 没有事件发生则返回; 返回-1, 设置errno值

epoll_wait的events是一个传出参数, 调用epoll_ctl传递给内核什么值, 当epoll_wait返回的时候, 内核就传回什么值,不会对struct event的结构体变量的值做任何修改。

epoll优缺点

epoll优点:

性能高,百万并发不在话下,而select就不行

epoll缺点:

不能跨平台,linux下的

epoll代码实现

#include <errno.h>

#include <netinet/in.h>

#include <stdio.h>

#include <stdlib.h>

#include <string.h>

#include <sys/socket.h>

#include <sys/types.h>

#include <unistd.h>

#include <sys/poll.h>

#include <sys/epoll.h>

#include <pthread.h>

#define POLL_SIZE 1024

#define MAX_LEN  4096

int main(int argc, char **argv) {

    int listenfd, connfd, n;

    char buff[MAX_LEN];

    struct sockaddr_in svr_addr;

    memset(&svr_addr, 0, sizeof(svr_addr));

    svr_addr.sin_family = AF_INET;

    svr_addr.sin_addr.s_addr = htonl(INADDR_ANY);

    svr_addr.sin_port = htons(8081);

    if ((listenfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {

        printf("create socket error: %s(errno: %d)\n", strerror(errno), errno);

        return 0;

    }

    if (bind(listenfd, (struct sockaddr *) &svr_addr, sizeof(svr_addr)) == -1) {

        printf("bind socket error: %s(errno: %d)\n", strerror(errno), errno);

        return 0;

    }

    if (listen(listenfd, 10) == -1) {

        printf("listen socket error: %s(errno: %d)\n", strerror(errno), errno);

        return 0;

    }

    int epfd = epoll_create(1); //int size

    struct epoll_event events[POLL_SIZE] = {0};

    struct epoll_event ev;

    ev.events = EPOLLIN;

    ev.data.fd = listenfd;

    epoll_ctl(epfd, EPOLL_CTL_ADD, listenfd, &ev);

    while (1) {

        int nready = epoll_wait(epfd, events, POLL_SIZE, 5);

        if (nready == -1) {

            continue;

        }

        int i = 0;

        for (i = 0; i < nready; i++) {

            int actFd = events[i].data.fd;

            if (actFd == listenfd) {

                struct sockaddr_in cli_addr;

                socklen_t len = sizeof(cli_addr);

                if ((connfd = accept(listenfd, (struct sockaddr *) &cli_addr, &len)) == -1) {

                    printf("accept socket error: %s(errno: %d)\n", strerror(errno), errno);

                    return 0;

                }

                printf("accept\n");

                ev.events = EPOLLIN;

                ev.data.fd = connfd;

                epoll_ctl(epfd, EPOLL_CTL_ADD, connfd, &ev);

            }

            else if (events[i].events & EPOLLIN) {

                n = recv(actFd, buff, MAX_LEN, 0);

                if (n > 0) {

                    buff[n] = '\0';

                    printf("recv msg from client: %s\n", buff);

                    send(actFd, buff, n, 0);

                }

                else if (n == 0) { //

                    epoll_ctl(epfd, EPOLL_CTL_DEL, actFd, NULL);

                    close(actFd);

                }

            }

        }

    }

    return 0;

}


本文链接:https://www.it72.com/12738.htm

推荐阅读
最新回复 (0)
返回