注:如无特殊说明,sockfd 原始状态都是阻塞的。
一、使用alarm 函数设置超时
1 2 3 4 5 6 7 8 9 10 11 12 13 | void handler(int sig) { } signal(SIGALRM, handler); alarm(5); |
程序大概框架如上所示,如果read在5s内被SIGALRM信号中断而返回,则表示超时,否则未超时已读取到数据,取消闹钟。但这种方法不常用,因为有时可能在其他地方使用了alarm会造成混乱。
二、使用套接字选项SO_SNDTIMEO、SO_RCVTIMEO
1 2 3 4 5 6 | struct timeval timeout = {3,0}; setsockopt(sock, SOL_SOCKET, SO_RCVTIMEO, (char *)&timeout, sizeof(struct timeval)); int ret = read(sock, buf, sizeof(buf)); |
即使用setsockopt 函数进行设置,但这种方法可移植性比较差,不是每种系统实现都有这些选项。
三、使用select 实现超时
下面程序包含read_timeout、write_timeout、accept_timeout、connect_timeout 四个函数封装
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 | /************************************************************************* > File Name: sysutil.c > Author: Simba > Mail: dameng34@163.com > Created Time: Sat 02 Mar 2013 10:53:06 PM CST ************************************************************************/ #include "sysutil.h" /* read_timeout - 读超时检测函数,不含读操作 int read_timeout(int fd, unsigned int wait_seconds) fd_set read_fdset; FD_ZERO(&read_fdset); timeout.tv_sec = wait_seconds; do if (ret == 0) } return ret; /* write_timeout - 写超时检测函数,不含写操作 int write_timeout(int fd, unsigned int wait_seconds) fd_set write_fdset; FD_ZERO(&write_fdset); timeout.tv_sec = wait_seconds; do if (ret == 0) } return ret; /* accept_timeout - 带超时的accept int accept_timeout(int fd, struct sockaddr_in *addr, unsigned int wait_seconds) if (wait_seconds > 0) fd_set accept_fdset; timeout.tv_sec = wait_seconds; do if (ret == -1) if (addr != NULL) return ret; /* activate_nonblock - 设置IO为非阻塞模式 flags |= O_NONBLOCK; /* deactivate_nonblock - 设置IO为阻塞模式 flags &= ~O_NONBLOCK; /* connect_timeout - 带超时的connect if (wait_seconds > 0) ret = connect(fd, (struct sockaddr *)addr, addrlen); fd_set connect_fdset; timeout.tv_sec = wait_seconds; do if (ret == 0) else if (ret == 1) if (wait_seconds > 0) return ret; |
下面来解析一下这些函数的封装:
1 2 3 4 5 6 7 8 | int ret; ret = read_timeout(fd, 5); if (ret == 0) read(fd, buf, sizeof(buf)); else if (ret == -1 && errno == ETIMEOUT) printf("timeout...\n"); else ERR_EXIT("read_timeout"); |
如果 read_timeout(fd, 0); 则表示不检测超时,函数直接返回为0,此时再调用read 将会阻塞。
当wait_seconds 参数大于0,则进入if
括号执行,将超时时间设置为select函数的超时时间结构体,select会阻塞直到检测到事件发生或者超时。如果select返回-1且errno
为EINTR,说明是被信号中断,需要重启select;如果select返回0表示超时;如果select返回1表示检测到可读事件;否则select返回-1
表示出错。
2、write_timeout :此函数跟read_timeout 函数类似,只是select 关心的是可写事件,不再赘述。
3、accept_timeout :此函数是带超时的accept
函数,如果能从if (wait_seconds > 0) 括号执行后向下执行,说明select
返回为1,检测到已连接队列不为空,此时再调用accept 不再阻塞,当然如果wait_seconds == 0 则像正常模式一样,accept
阻塞等待,注意,accept 返回的是已连接套接字。
4、connect_timeout :在调用connect前需要使用fcntl
函数将套接字标志设置为非阻塞,如果网络环境很好,则connect立即返回0,不进入if
大括号执行;如果网络环境拥塞,则connect返回-1且errno ==
EINPROGRESS,表示正在处理。此后调用select与前面3个函数类似,但这里关注的是可写事件,因为一旦连接建立,套接字就可写。还需要注意的是当select
返回1,可能有两种情况,一种是连接成功,一种是套接字产生错误,由这里可知,这两种情况都会产生可写事件,所以需要使用getsockopt来获取一下。退出之前还需重新将套接字设置为阻塞。
我们可以写个小程序测试一下connect_timeout 函数,客户端程序如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 | #include "sysutil.h" int main(void) struct sockaddr_in servaddr; int ret = connect_timeout(sock, &servaddr, 5); struct sockaddr_in localaddr; printf("ip=%s port=%d\n", inet_ntoa(localaddr.sin_addr), ntohs(localaddr.sin_port)); return 0; |
因为是在本机上测试,所以不会出现超时的情况,但出错的情况还是可以看到的,比如不要启动服务器端程序,而直接启动客户端程序,输出如下:
simba@ubuntu:~/Documents/code/linux_programming/UNP/socket$ ./echocli_timeout
connect_timeout: Connection refused
很明显是connect_timeout 函数返回了-1,我们也可以推算出connect_timeout 函数中,select返回1,但却是套接字发生错误的情况,errno = ECONNREFUSED,所以打印出Connection refused。
在这里可以粗略说下tcp connect 的机制,connect 只是完成发送 syn 的过程,后续的两次握手由协议栈完成。如果 fd 是 阻塞的,则 connect 会一直
等到超时或者连接成功返回;如果 fd 是非阻塞的,则 connect 会立刻返回,但此时协议栈是否已经完成连接要判断下返回值和 errno;无论 fd 阻塞还
是非阻塞,如果没有设置超时,则当重传 syn 次数达到 sysctl net.ipv4.tcp_syn_retries 时才超时结束,重传 syn 的时间采取指数退避的方式,假设
syn_retries 为5, 则分别为 1, 2, 4, 8, 16, 32 ... 即在目标 ip 不可达时要几十秒才 timeout(如果是ip 可达,但没有对应的监听端口,则在一次重试
后,对端机器会发送reset 标志,连接结束,耗时 1s 多),故:
如果是非阻塞方式,按照stevens 建议,如上面的做法即可;
如果是阻塞方式,可以用 setsockopt 设置 SO_SNDTIMEO 即可。
参考:
《Linux C 编程一站式学习》
《TCP/IP详解 卷一》
《UNP》