linux系统收到SYN但不回SYN+ACK问题排查-阿里云开发者社区

linux系统收到SYN但不回SYN+ACK问题排查

2017-11-16 4133

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

一，背景：

今天下午发现线上的一台机器从办公网登录不上且所有tcp端口都telnet不通，但是通过同机房的其它机器却可以正常访问到出问题的机器。于是就立即在这台出问题的server端抓包分析，发现问题如下：
server端收到了本地pc发的SYN包，但是没有回syn+ack包，所以确认是server端系统问题。tcpdump抓包如下：

二，排查

1，发现系统没有任何负载

2，网卡也没有丢包

3，iptables策略也都没问题

4，系统的SYN_RECV连接很少，也没超限

5，系统的文件描述符等资源也都没问题

6，messages和dmesg中没有任何提示或者错误信息

7，通过netstat命令查看系统上协议统计信息，发现很多请求由于时间戳的问题被rejected

 
         # netstat -s |grep reject 
        
         2181 passive connections rejected because of 
         time 
         stamp 
        
         34 packets rejects in established connections because of timestamp

三，通过google来协助

发现有同样的人遇见这个问题：

是通过调整sysctl -w net.ipv4.tcp_timestamps=0或者sysctl -w net.ipv4.tcp_tw_recycle=0来解决这个问题，于是我就顺藤摸瓜继续查。

而在查询这两个参数的过程中，发现问题原因如下：

发现是 Linux tcp_tw_recycle/tcp_timestamps设置导致的问题。因为在linux kernel源码中发现tcp_tw_recycle/tcp_timestamps都开启的条件下，60s内同一源ip主机的socket connect请求中的timestamp必须是递增的。经过测试，我这边centos6系统（kernel 2.6.32）和centos7系统（kernel 3.10.0）都有这问题。

 
         源码函数：kernel 2.6.32 tcp_v4_conn_request(),该函数是tcp层三次握手syn包的处理函数（服务端）； 
        
         源码片段： 
        
         if 
         (tmp_opt.saw_tstamp && 
        
         tcp_death_row.sysctl_tw_recycle && 
        
         (dst = inet_csk_route_req(sk, req)) != NULL && 
        
         (peer = rt_get_peer((
         struct 
         rtable *)dst)) != NULL && 
        
         peer->v4daddr == saddr) { 
        
         if 
         (get_seconds() < peer->tcp_ts_stamp + TCP_PAWS_MSL && 
        
         (s32)(peer->tcp_ts - req->ts_recent) > 
        
         TCP_PAWS_WINDOW) { 
        
         NET_INC_STATS_BH(sock_net(sk), LINUX_MIB_PAWSPASSIVEREJECTED); 
        
         goto 
         drop_and_release; 
        
         } 
        
         } 
        
         tmp_opt.saw_tstamp：该socket支持tcp_timestamp 
        
         sysctl_tw_recycle：本机系统开启tcp_tw_recycle选项 
        
         TCP_PAWS_MSL：60s，该条件判断表示该源ip的上次tcp通讯发生在60s内 
        
         TCP_PAWS_WINDOW：1，该条件判断表示该源ip的上次tcp通讯的timestamp 大于 本次tcp

总结：

我这边和其它同事通过公司出口（NAT网关只有1个ip地址）访问问题server，由于timestamp时间为系统启动到当前的时间，故我和其它同事的timestamp肯定不相同；根据上述SYN包处理源码，在tcp_tw_recycle和tcp_timestamps同时开启的条件下，timestamp大的主机访问serverN成功，而timestmap小的主机访问失败。并且，我在办公网找了两台机器可100%重现这个问题。

解决：

# echo "0" > /proc/sys/net/ipv4/tcp_tw_recycle

四，扩展

1，net.ipv4.tcp_timestamps

tcp_timestamps的本质是记录数据包的发送时间。基本的步骤如下：

发送方在发送数据时，将一个timestamp(表示发送时间)放在包里面
接收方在收到数据包后，在对应的ACK包中将收到的timestamp返回给发送方(echo back)
发送发收到ACK包后，用当前时刻now - ACK包中的timestamp就能得到准确的RTT

当然实际运用中要考虑到RTT的波动，因此有了后续的(Round-Trip Time Measurement)RTTM机制。

TCP Timestamps Option (TSopt)具体设计如下

 
         Kind: 8             
         // 标记唯一的选项类型，比如window scale是3 
        
         Length: 10 bytes    
         // 标记Timestamps选项的字节数 
        
         +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ 
        
         | Kind=8 | Length=10 | TS Value (TSval) | TS ECho Reply (TSecr) | 
        
         +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++  
        
         1          1             4                       4

timestamps一个双向的选项，当一方不开启时，两方都将停用timestamps。比如client端发送的SYN包中带有timestamp选项，但server端并没有开启该选项。则回复的SYN-ACK将不带timestamp选项，同时client后续回复的ACK也不会带有timestamp选项。当然，如果client发送的SYN包中就不带timestamp，双向都将停用timestamp。

tcp数据包中timestamps的value是系统开机时间到现在时间的（毫秒级）时间戳。

参数：

0：停用

1：启用(系统默认值)

2，net.ipv4.tcp_tw_recycle

TCP规范中规定的处于TIME_WAIT的TCP连接必须等待2MSL时间。但在linux中，如果开启了tcp_tw_recycle，TIME_WAIT的TCP连接就不会等待2MSL时间（而是rto或者60s），从而达到快速重用（回收）处于TIME_WAIT状态的tcp连接的目的。这就可能导致连接收到之前连接的数据。为此，linux在打开tcp_tw_recycle的情况下，会记录下TIME_WAIT连接的对端（peer）信息，包括IP地址、时间戳等。这样，当内核收到同一个IP的SYN包时，就会去比较时间戳，检查SYN包的时间戳是否滞后，如果滞后，就将其丢掉（认为是旧连接的数据）。这在绝大部分情况下是没有问题的，但是对于我们实际的client-server的服务，访问我们服务的用户一般都位于NAT之后，如果NAT之后有多个用户访问同一个服务，就有可能因为时间戳滞后的连接被丢掉。

参数：

0：停用(系统默认值)

1：启用

本文转自 leejia1989 51CTO博客，原文链接：http://blog.51cto.com/leejia/1954628，如需转载请自行联系原作者

linux系统收到SYN但不回SYN+ACK问题排查

热门文章

最新文章

相关课程

相关电子书

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

linux系统收到SYN但不回SYN+ACK问题排查

热门文章

最新文章

相关课程

相关电子书

推荐镜像