重传机制
.
重传机制基于序列号
超时重传
RTO(Retransmission Timeout,超时重传时间),过大和过小都会出现问题👇
.
一般RTO应该略大于RTT,由于RTT是动态变化的,所以RTO也应该是动态变化的
对于单次数据而言,每当遇到一次超时重传时,都会把RTT翻倍,这是因为网络环境很差,不宜频繁发送
估算RTT的方法
真实的RTT变化较大,而我们希望RTT的变化更加平滑,所以使用系数$α$进行加权过渡
$$
T_{avg}=αT_{cur}+(1-α)T_{avg}
$$
.
快速重传
超时重传需要等待时间,比较慢,快速重传解决了这一问题
快速重传不以时间为驱动,而以数据为驱动👇
.
由于Seq2一直没有到,所以接收方会一直回ACK2
SACK
由于是三个相同的ACK,快速重传并不知道该重传哪个Seq(上图只是情况之一),
SACK(Selective Acknowledgement,选择性确认)解决了这一问题
- ACK=现在需要的起始序列号,即ACK之前的数据都已收到
- SACK只有在发生异常的时候才会出现,并且SACK=异常发生后的接收到的首尾序列号
按照以上的生成规则,可以很好地区分并处理以下三种情况,使得发送者只需要重传缺失的数据段:
- 数据丢包
.
- 网络延迟
.
- ACK丢包
.
滑动窗口
若收到ACK后才发送下一条数据,则通信效率会很低
于是可以使用窗口,意为消息队列的容量大小,其底层是OS内开辟的缓存空间
- 发送方主机必须保留已发送的数据,收到应答后再从缓冲区中清除
- 接收方同样需要在缓存空间内存储未处理的数据
.
图中窗口大小=3,即使ACK 600丢失,也可以通过ACK 700确认,叫做累计确认或累计应答
通常窗口的大小通常是由接收方决定的,因为如果发送方的窗口大于接收方,接收方则有可能收不到数据
发送方的滑动窗口
.
.
.
四个不同的区域由两个指针维护👇
.
接收方的滑动窗口
.
流量控制
指TCP的发送方根据接收方的接收能力控制发送的数据量
流量控制是目的,滑动窗口是实现方式
.
丢包问题
但是如果接收方同时减小缓存区大小并且应用层不读取任何数据,可能会出现丢包现象👇
.
【解决方式】TCP不允许同时减小缓存并收缩窗口,而是先收缩窗口,过段时间再减小缓存(感觉还是没有彻底消除????)
死锁问题
如果告知窗口打开的ACK报文丢失,双方就会陷入死锁👇
.
【解决方式】窗口关闭后发送方启动计时器,超时后发送窗口探测(window probe)报文👇
.
窗口探测次数一般为3次,超过3次后如果窗口仍然关闭,有的TCP会让发送方发送RST报文中断连接
糊涂窗口综合征
如果窗口仅剩几个字节,发送方仍然会继续发送,但是TCP+IP头一共40字节,这样的开销显然很不经济,这就叫糊涂窗口综合征
就好像⼀个可以承载 50 人 的大巴车,每次只来了一两个⼈,就直接发车
解决方式有两种
接收方不通告小窗口
通常的策略是,当”窗口大小<min(MSS,缓存空间/2)”时,ACK报文中的窗口大小直接设为0
发送方不发送小数据
通常的策略是,发送方使用Nagle算法,原理是囤积数据,直到满足以下条件之一才发送
- 窗口大小>=MSS
- 数据大小>=MSS
- 收到ACK
此外,对于一些小数据包交互的场景(如telnet、ssh),需要把Nagle关闭
拥塞控制
有了流量控制,为何还要拥塞控制?
流量控制针对发送方和接收方,而拥塞控制针对网络拥堵
当网络拥堵时,若发送大量数据则易产生丢包和延迟,这会导致重传,而重传又加剧了网络的拥堵,所以需要拥塞控制
拥塞控制利用拥塞窗口(cwnd),主动减少发送的数据量,来避免发送方的数据填满整个网络
拥塞窗口是发送方维护的状态变量,根据网络的拥堵情况动态变化
发送窗口(swnd),接收窗口(rwnd),拥塞窗口(cwnd)三者的关系为
$$
rwnd=min(swnd,cwnd)
$$
拥塞控制主要有以下四大控制算法
慢启动
慢启动的意思就是TCP刚建立连接时,一点一点地扩大拥塞窗口,每当发送方每收到一个ACK,cwnd++
.
拥塞避免
当cwnd>=ssthresh(slow start threshold,慢启动阈值)时,就会启动拥塞避免算法,一般ssthresh=65535字节
每当发送方每收到一个ACK,cwnd+=1/cwnd,几乎是线性增长
.
拥塞发生
该状态只持续一瞬间
由于拥塞避免算法仍会使cwnd增长,一旦发生重传,就会启动拥塞发生算法,分为两种
超时重传
ssthresh=cwnd/2
wnd=1
进入慢启动
.
这种方式会使cwnd急剧下降,造成网络卡顿
快速重传
快速重传因为只丢了一小部分包,TCP认为这种情况不严重,所以采用以下算法
cwnd/=2
ssthresh=cwnd
进入快速恢复算法
快速恢复
- cwnd=ssthresh+3(意思是有3个重复的ACK收到了)
- 重传丢失的数据包
- 如果再次收到重复的ACK,cwnd++
- 如果收到了新的ACK,把 cwnd 设置为第⼀步中的 ssthresh 的值,原因是新的ACK说明从重复ACK时的数据都已收到,恢复过程已经结束,所以回到拥塞避免状态(???????)
.