错误排查思路:如何排查Connection refused

本文涉及的产品
云防火墙,500元 1000GB
.cn 域名,1个 12个月
简介: 遇到ConnectionRefused Exception异常时的排查思路和常见的linux网络命令

问题出现场景

我在使用hdfs的时候,报出如下异常:

java.net.ConnectException: Connection refused

排查思路

 ConnectionRefused Exception的定义如下:

You get a  ConnectionRefused Exception when there is a machine at the address specified, but there is no program listening on the specific TCP port the client is using -and there is no firewall in the way silently dropping TCP connection requests.

—— http://wiki.apache.org/hadoop/ConnectionRefused

即对应地址和端口没有进程进行TCP监听。

那么大致的排查思路就有了,从上到下为:

  1. 确保ip和端口正确(已经服务器应用是否启动)
  2. ping一下网络,看是否正常
  3. 查看端口是否有TCP监听
root@ecs-284712:~ netstat -tlpn
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name    
tcp        0      0 127.0.0.53:53           0.0.0.0:*               LISTEN      537/systemd-resolve 
tcp        0      0 0.0.0.0:50070           0.0.0.0:*               LISTEN      10442/java          
tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN      2280/sshd           
tcp        0      0 0.0.0.0:50010           0.0.0.0:*               LISTEN      10613/java          
tcp        0      0 0.0.0.0:50075           0.0.0.0:*               LISTEN      10613/java          
tcp        0      0 0.0.0.0:50020           0.0.0.0:*               LISTEN      10613/java          
tcp        0      0 127.0.0.1:9000          0.0.0.0:*               LISTEN      10442/java          
tcp        0      0 0.0.0.0:50090           0.0.0.0:*               LISTEN      10809/java       

当发现地址为127.0.0.1时要注意,该地址仅单机可使用,外界不能连接。(一般都是/etc/hosts文件的域名映射不正确,将localhost映射为127.0.0.1, 我个人将hdfs配置文件etc/hadoop/core-site.xml中的localhost改为0.0.0.0可行)

  1. 查看防火墙是否开放该端口
# 1. 查看ufw的状态
root@ecs-284712:~ sudo ufw status

# 2. 开启ufw
root@ecs-284712:~ sudo ufw enable


# 3. 重启防火墙
root@ecs-284712:~ sudo ufw reload

# 4. 对外开启端口
root@ecs-284712:~ sudo ufw allow 9000


# 5. 关闭防火墙
root@ecs-284712:~ sudo ufw disable
  1. 阿里云、华为云等ESC服务器,一般要在安全组配置对应端口

ps: 顺便吐槽一下,我的云服务器突然ssh登陆不上了,找了一下午才发现是因为我开启了防火墙,没把端口22开放。

补充: linux常见网络请求

网络环境查看命令

  • ifconfig : 查看IP与子网掩码
  • 关闭与启动网卡

    • ifdown 网卡设备名 :禁用该网卡设备
    • ifup 网卡设备名 :启用该网卡设备
  • route 命令设置网关

    • route -n 查看路由列表(可以看到网关)
    • route add default gw 192.168.1.1 临时设置网关
  • netstat 选项 :查询网络状态

    • -t:列出TCP协议端口
    • -u:列出UDP协议端口
    • -n:不使用域名与服务名,而是使用IP地址和端口号
    • -l :仅列出在监听状态网络连接
    • -a:列出所有的网络连接
$ netstat -tn
Active Internet connections (w/o servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State
tcp        0      0 172.16.247.46:47302     100.100.30.25:80        ESTABLISHED  //已经建立连接
tcp        0     36 172.16.247.46:22        171.14.145.224:32371    ESTABLISHED
tcp        0      0 172.16.247.46:22        171.14.145.224:32732    ESTABLISHED
$ netstat -tnl
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State
tcp        0      0 0.0.0.0:8080            0.0.0.0:*               LISTEN   //说明tomcat已经启动
tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN
tcp        0      0 127.0.0.1:8005          0.0.0.0:*               LISTEN
$ netsate -an | grep  ESTABLISHED | wc -l   统计建立的连接数 

网络通信命令

  • ping [选项] ip或域名 : 探测指定IP或域名的网络状况. ( -c 次数:指定ping包的次数)
  • telnet [ip或域名] [端口] : 远程管理与端口探测命令。由于telnet明文传输,不建议用于远程管理,但可以探测端口是否开启。
  • traceroute [选项] ip或域名 : 路由跟踪命令(采用ICMP协议,-n 使用IP,不使用域名,速度更快
  • wget命令:下载命令

Linux环境变量

Linux环境变量设置

  • /etc/environment : 设置整个系统的环境。

img

  • /etc/profile : 此文件为所有用户设置环境信息。当用户第一次登录时,该文件被执行。
  • /etc/bashrc : 为每一个运行bash shell的用户执行此文件.当bash shell被打开时,该文件被读取。
  • ~/.bash_profile : 文件为单个用户设置环境信息。当用户登录时,该文件仅仅执行一次。默认情况下,他设置一些环境变量,执行用户的.bashrc文件。
  • ~/.bashrc : 当登录时以及每次打开新的shell时,该文件被读取。(zsh配置 ~/.zshrc)
  • ~/.bash_logout: 当每次退出系统(退出bash shell)时,执行该文件。
  • export: 设置临时变量。终端关闭时失效。
相关文章
|
关系型数据库 MySQL 数据库
一文剖析MySQL主从复制异常错误代码13114
一文剖析MySQL主从复制异常错误代码13114
1128 0
|
监控 网络协议 前端开发
502问题怎么排查?
502问题怎么排查?
190 0
|
Web App开发 开发框架 安全
503错误和500错误故障解决案例
记录下特殊的503和500报错场景
221 0
|
SQL 存储 网络协议
故障解决:Sql Server 2008 error 40出现连接错误的解决方法
经常会有小伙伴反馈连接错误,今天就给大家重现一下这个错误和解决方法吧,下次如果哪个小伙伴也遇到类似问题可以直接转发这篇文章给他。好了我们开始实验。
故障解决:Sql Server 2008 error 40出现连接错误的解决方法
|
消息中间件 监控 druid
排查数据库连接池错误
最近在使用druid数据源时,碰到一个问题closed connection。在本地及测试环境都运行正常,但是在正式环境,过一段时间就出现closed conneciton问题,关闭的连接。
788 0
|
Kubernetes NoSQL 网络协议
连接池你用对了吗?一次Unexpected end of stream异常的排查
# 能收获什么? 1. 更加了解TCP协议 2. Redis与客户端关闭连接的机制 3. 基于Apache Common连接池的参数调优 4. Linux网络抓包
1740 0
连接池你用对了吗?一次Unexpected end of stream异常的排查
|
网络协议 NoSQL Redis
predis连接问题(connection refused)排查
## 背景 最近有用户报使用PHP客户端`predis`访问阿里云`Redis`(原`KVStore`)时,会出现`connection refused`错误,用户怀疑是因为后端连接数超了,导致连接被拒绝,但是监控看连接数并没有超过阈值,进而怀疑是后端redis的连接数限制逻辑有问题,经过排查发现连接数限制逻辑并没有问题,下面说下具体的排查过程。 ## 排查过程 通常通过`socke
8943 0
|
关系型数据库 Java MySQL
一则线上MySql连接异常的排查过程
Mysql作为一个常用数据库,在互联网系统应用很多。有些故障是其自身的bug,有些则不是,这里以前段时间遇到的问题举例。
1798 0