0. 什么是TCP

TCP,全称Transmission Control Protocol,是一种面向连接、可靠的、基于字节流的单播协议。与我们常说的TCP/IP协议不同,TCP/IP是一个协议族,涉及到OSI模型中的网络层、应用层和应用层。而我们要聊的TCP就是在传输层的协议,现在应用的特别广泛的HTTP请求,就是基于TCP的。

1. 三次握手

在做数据交换之前,通信双方必须在彼此建立一条连接。也就是通信双方都维护了一份对方的信息,比如IP地址和端口号。说到建立连接,就不得不提到经典的三次握手和四次挥手。

1.1 为什么不两次握手

三次握手让通信双方都明确有一个连接正在建立,也为了确保客户端和服务器同时具有发送接收的能力。而两次握手做不到这一点。我们现在从另外一个角度来看一下三次握手,那就是为什么要三次握手?我两次握手它不香吗?让我们用一段对话来模拟如果真的采用两次握手,会带来什么问题。

按照人的逻辑来说,这已经是一次正常的对话了是吧,下一步难道不是建立连接吗?说下一步之前,需要先了解做三次握手的目的是什么。三次握手让通信双方都明确有一个连接正在建立,也为了确保客户端和服务器同时具有发送接收的能力。

我们来分析一下上面的那段对话。

服务器不清楚客户端是否有接收能力的情况下,就算数据包真的发出去了,但无法知道客户端是否收到了数据。这样的就是不可靠的连接了。

而且,真实的网络传输中,出现网络延迟是常有的事,如果客户端发送了请求建立连接的数据包,由于网络延迟,数据包没有到达,客户端又发了一次,服务器收到之后建立了连接。

但是当前的连接关闭后,由于网络延迟的没有到达的包到了服务器,服务器又建立了连接,但是此时客户端已经断开了,这样就白白浪费了服务器的资源。

如果觉得上面的例子还是不能让你理解, 为什么两次握手不行。请看下面这个终极例子。

如果你是被借钱的那个,你敢把钱转过去吗?

简单总结一下两次握手所带来的问题:不可靠,还会造成网络资源的浪费。

1.2 三次握手的过程

上面我们讨论了为什么要三次握手,接下来我们用几个专业术语来解释一下三次握手的过程。

  • 服务器开始监听某个端口,此时服务器进入了LISTEN状态

  • 客户端最初是CLOSED状态,然后向服务器发送一个SYN标志位的数据包,主动发起连接。客户端变成SYN-SENT状态

  • 服务器接收到客户端的SYN数据包,通过标志位知道了客户端想要建立连接。于是回了客户端一个SYN和ACK,表示收到了请求。服务器的自身状态变为了SYN-RCVD

  • 客户端收到了服务器的ACK,表示服务器知道了客户端想要建立连接。然后客户端再给服务器回了一个ACK表示自己收到了(或者说能够收到)服务器的消息,发送完这个ACK后,客户端的状态变成了ESTABLISH

  • 服务器收到了客户端的ACK,服务器的状态也变成ESTABLISH

2. 四次挥手

2.1 模拟四次挥手

老规矩,还是让我们用一段对话来模拟TCP的四次挥手。

这就是通俗版本的四次挥手的解释,下面从专业的角度来看看。

2.2 四次挥手的过程

我们来看一下完整的流程。

  • 最初,客户端和服务器都处于ESTABLISH状态

  • 客户端想要断开连接,便主动向服务器发送标志位为FIN的数据包。发送之后客户端的状态变为FIN-WAIT-1,同时客户端也变成了半关闭状态,即无法向服务器发送数据包了,只能接收来自服务器的数据

  • 服务器收到客户端的FIN数据包,状态变为CLOSE-WAIT,并回给客户端一个表示确认的数据包ACK

  • 客户端收到了ACK之后,状态变为FIN-WAIT-2

  • 然后,服务器向客户端发送FIN数据包,服务器状态变为LAST-ACK

  • 客户端收到FIN数据包,客户端状态变为TIME-WAIT。然后回一个确认数据包ACK给服务器

  • 然后客户端等待2MSL,如果在这段时间内,没有收到服务器重发的消息,说明服务器收到了ACK

  • 四次挥手到此结束,连接断开

我们再来模拟一次刚刚的场景。

实际情况是,如果是两次挥手,也就是把服务器给客户端的ACK和FIN合并为同一个,如果此时网络出现了延迟,站在客户端的角度来看,客户端会认为刚刚发送的FIN报文并没有到达服务器,于是会在再重新发送一次。如果延迟的时间较长,那么客户端将会一直重新发送FIN的TCP报文。

2.3 对比分析

结合抽象和具体的四次挥手,其实就很好理解了,我们用一个表格来总结一下。

你和你的朋友在外面high客户端和服务器建立了连接
你和朋友说你要走了客户端主动向服务器发送FIN,客户端状态变为FIN-WAIT-1
你的朋友听到了并理解了你要说的话,并通过肢体语言反馈给你他知道了服务器收到FIN数据包,并回了一个ACK,服务器的状态变为CLOSE-WAIT。客户端收到ACK之后变为FIN-WAIT-2
你的朋友说“那好吧, 路上注意安全哈”服务器向客户端发送FIN包,服务器变为LAST-CHECK。
你说“好的,下次再约”客户端收到FIN包后状态变为TIME-WAIT。并回一个ACK给服务器。
你迟疑了一下,你的朋友并没有挽留你客户端等待2MSL,如果没有收到服务器的重发消息,则说明服务器收到了ACK。
你离开了和朋友的聚会四次挥手结束,连接断开

2.4 为什么要等待

MSL,即Maximun Segment LifeTime,报文最大生存时间。为什么在TIME-WAIT之后还需要等待2MSL呢?主要是两个原因,让我们结合例子来理解一下。

保证服务器收到ACK

这种情况就是服务器并没有收到客户端收到的ACK,站在服务器的角度,服务器并不知道客户端收到了自己发的FIN包。也就不会断开连接,但是客户端已经单方面的断开连接了。又造成了服务器的资源浪费,服务器也无法进入正常的关闭连接状态。

防止失效的数据包

这种情况是指,客户端没有等待2MSL就直接断开,但是服务器此时仍然有些数据包需要发送,或者已经发了出去。但是数据包到了后,此时的端口已经被新的连接占用了,老的TCP报文就会与新连接的TCP报文冲突、混淆。

3. 结尾

后面如果我有时间,会继续尝试把枯燥的理论抽象成生活中一些简单的现象并且与专业的知识结合起来的文章风格,来帮助那些看理论知识很吃力的人。其实只要理解了整个思路,是不需要去死记硬背的。

如果文章中有不对的地方,还望各位大佬不吝赐教。

拜了个拜

【俗话说】换个角度理解TCP的三次握手和四次挥手-LMLPHP

05-11 13:58