Socket 是网络协议栈暴露给编程人员的 API,相比复杂的计算机网络协议,API 对关键操作和配置数据进行了抽象,简化了程序编程。

        本文讲述的 socket 内容源自 Linux 发行版 centos 9 上的 man 工具,和其他平台(比如 os-x 及不同版本会有些出入)。本文主要对各 API 进行详细介绍,从而更好的理解 socket 编程。

一.socket() 

1.库

标准 c 库,libc, -lc

2.头文件

<sys/socket.h>

3.接口定义

int socket(int domain, int type, int protocol);

4.接口描述

        创建一个通信端点(endpoint,通信的每一端都可以成为一个 endpoint),返回指向该端点的文件描述符。socket() 是所有其他操作的前提,比如创建了 socket,才能进一步的设置以及使用网络。

5.参数

  • domain
    socket 的网络协议簇,通常包括:
    AF_INET ipv4     网络协议
    AF_INET6 ipv6    网络协议(有时也会兼容 ipv4)
    AF_UNIX          本地socket,也就是我们常说的 domain socket
  • type 
    SOCK_STREAM      (TCP)有序、可靠、双向的基于连接的字节流,可选支持带外数据传输
    SOCK_DGRAM       (UDP)数据报文传输,非连接的、不可靠的、有固定最大长度
    SOCK_SEQPACKET   (不粘包的 TCP)有序、可靠、双向具有最大数据报长度的传输
    SOCK_RAW          提供原始网络协议访问
    SOCK_RDM          提供可靠的数据报传输层,但是不保证报文顺序
    
  • protocol
    指定具体的传输协议,比如 IPPROTO_TCP, IPPROTO_SCTP, IPPROTO_UDP, IPPROTO_DCCP,在netinet/in.h 中定义

6.返回值

        发生错误时返回 -1,设置 errno 指示错误码,否则返回一个新创建的整型文件描述符。

        可能的错误码包括:

二、bind

1.库

标准 c 库,libc, -lc

2.头文件

<sys/socket.h>

3.接口定义

 int bind(int sockfd, const struct sockaddr *addr,
                socklen_t addrlen);

4.接口描述

        通过 socket() 接口创建 socket 后,socket 只存在于名字空间中,并没有实际的地址分配给它。bind 接口将 addr 指定的 IP 地址分配给由文件描述符 sockfd 指定的 socket。addrlen 指定了 addr 指针指向的地址结构的字节长度。以前我们将这个操作给 socket 分配名字。

        通常在 TCP_STREAM socket 接收连接前需要将一个本地地址通过 bind 分配给 socket。

        名字绑定规则随着地址家族的不同而不同。

         addr 的数据结构也是随着地址家族的变化而变化的。sockaddr 结构的定义类似:

 struct sockaddr {
      sa_family_t sa_family;
      char        sa_data[14];
 }

         这个结构定义主要是为了防止编译器报错,主要是将各种地址结构做一个强制转换。

5. 返回值

        发生错误时返回 -1,设置 errno 指示错误码,否则返回一个新创建的整型文件描述符。

        可能的错误码包括:

6.示例代码

       #include <stdio.h>
       #include <stdlib.h>
       #include <string.h>
       #include <sys/socket.h>
       #include <sys/un.h>
       #include <unistd.h>

       #define MY_SOCK_PATH "/somepath"
       #define LISTEN_BACKLOG 50

       #define handle_error(msg) \
           do { perror(msg); exit(EXIT_FAILURE); } while (0)

       int
       main(void)
       {
           int                 sfd, cfd;
           socklen_t           peer_addr_size;
           struct sockaddr_un  my_addr, peer_addr;

           sfd = socket(AF_UNIX, SOCK_STREAM, 0);
           if (sfd == -1)
               handle_error("socket");

           memset(&my_addr, 0, sizeof(my_addr));
           my_addr.sun_family = AF_UNIX;
           strncpy(my_addr.sun_path, MY_SOCK_PATH,
                   sizeof(my_addr.sun_path) - 1);

           if (bind(sfd, (struct sockaddr *) &my_addr,
                    sizeof(my_addr)) == -1)
               handle_error("bind");

           if (listen(sfd, LISTEN_BACKLOG) == -1)
               handle_error("listen");

           /* Now we can accept incoming connections one
              at a time using accept(2). */

           peer_addr_size = sizeof(peer_addr);
           cfd = accept(sfd, (struct sockaddr *) &peer_addr,
                        &peer_addr_size);
           if (cfd == -1)
               handle_error("accept");

           /* Code to deal with incoming connection(s)... */

           if (close(sfd) == -1)
               handle_error("close");

           if (unlink(MY_SOCK_PATH) == -1)
               handle_error("unlink");
       }

 三、accept

1.库

标准 c 库,libc, -lc

2.头文件

<sys/socket.h>

3.接口定义

int accept(int sockfd, struct sockaddr *_Nullable restrict addr,
                  socklen_t *_Nullable restrict addrlen);

#define _GNU_SOURCE             /* See feature_test_macros(7) */
#include <sys/socket.h>

int accept4(int sockfd, struct sockaddr *_Nullable restrict addr,
                  socklen_t *_Nullable restrict addrlen, int flags);

4.接口描述

        accept 系统调用用于面向连接的 socket (SOCK_STREAM、SOCK_SEQPACKET),它会从监听的 socket(sockfd)的等待连接队列里拿到第一个连接请求,创建一个新的连接的 socket,并返回一个新的文件描述指向这个新的 socket。新创建的 socket 并没有处于监听状态,原来的 socket(sockfd)并不会受到任何影响。

        sockfd 是由 sockect() 创建的,并通过 bind 绑定到了本地地址上,并通过 listen 监听连接。

        addr 是一个指向 sockaddr 结构的指针,这个地址由对端 socket 的地址填充。而返回的 addr 的结构类型根据 socket 地址家族的不同而不同。当 addr 是 NULL 时,底层并不会对其填充,这种情况下 addrlen 也没有用,也应该是 NULL。

        addrlen 参数是一个输入输出参数,调用者必须使用 addr 指向的结构体的大小来初始化它,而在返回时,则会使用对端地址的实际大小来填充。

        如果提供的 buffer 太小,则返回的地址将会被截断,这种情况下,addrlen 会返回一个比提供值大的值。

        如果当前等待连接队列中没有待连接请求,并且 socket 没有被设置成非阻塞,那么 accept() 将会一直阻塞。如果 socket 设置为非阻塞,那么 accept() 将报错为 EAGAIN 或者 EWOULDBLOCK。

        为了获取 socket 上有连接请求过来,我们需要使用 select、poll、epoll。当一个新连接来临时,会产生一个可读事件,我们可以使用 accept 来继续从连接上获取一个 socket。

        我们也可以设置 socket 上有连接时发送 SIGIO 信号。

        如果 flag 是 0,那么 accept4() 就等同于 accept()。flag 可以是下面配置的或起来的值,来实现不同的行为:

  • SOCK_NONBLOCK

                 设置新文件描述符的 O_NONBLOCK 属性

  • SOCK_CLOEXEC

                 设置新文件描述符的 FD_CLEXEC 属性。

5.返回值

        成功时,返回一个新接收的 socket 的文件描述符(非负值)。

        出错时,返回 -1,设置 errno 为错误码,addrlen 不会被修改。

  • 错误处理

        Linux 的 accept() 会将既存的网络错误也会给返回值,这个行为和其他 BSD socket 实现的行为不太一样。为了可靠性,我们应该处理 accept 返回网络错误,这些错误是和协议相关的。比如 EAGAIN 表示重传,在TCP/IP 的场景下,还有 ENETDOWN、 EPROTO、 ENOPROTOOPT, EHOSTDOWN、 ENONET、 EHOSTUNREACH、 EOPNOTSUPP、 ENETUNREACH等需要处理。

       可能的错误码包括:

09-07 23:54