nginx在云平台服务几个典型代理场景中的应用案例

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
实时计算 Flink 版,5000CU*H 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 在云平台服务中有多种场景需要使用到反向代理,常见的应用场景包括:内网专有云平台访问公网资源、公有云平台访问客户内网IDC机房资源、云产品通过代理访问多个不同的资源等等。笔者总结几种场景配置nginx的7层反向代理、4层反向代理,巧妙实现应用需求。

一、4层/7层nginx 代理的区别

nginx可以实现4层和7层代理,分别对应的是 stream模块 和 http模块。

1.1 4层nginx代理--stream模块

nginx的stream模块一般用于tcp/udp数据流的代理和负载均衡,可以通过stream模块代理转发tcp/udp消息。4层nginx的tcp/udp 代理在云平台服务场景中,最常见的应用案例是代理数据库连接(比如mysql、oracle等数据库):

(1)专有云平台与互联网隔离,需要4层nginx代理实现云平台产品(比如ECS、DataWorks、DataPhin、DTS等)可以连接到互联网的数据库。

(2)反过来,公有云平台与客户内网IDC机房隔离,需要4层nginx代理实现云平台产品(比如ECS、DataWorks、DataPhin、DTS等)可以连接到客户内网IDC机房部署的数据库。

本质上,4层nginx代理在对网络包进行代理目标IP和端口的更换,而不需要关心7层http代理的域名逻辑。

1.2 7层nginx代理--http模块

nginx的http模块一般用于http/https7层业务的代理。7层nginx代理在云平台服务场景中,最常见的应用案例是代理业务系统。与4层代理类似,也分为专有云平台访问互联网业务系统、公有云平台访问客户内网IDC机房的业务系统。与4层代理不同的是,7层代理不仅仅需要对网络包进行代理目标ID和端口的更换,还需要关心域名后缀和参数。通常采用location机制实现域名后缀和参数的识别,进而将反向代理请求转发到不同的目标域名。

二、4层nginx 代理的典型应用场景

2.1 专有云平台访问互联网数据库

在大型企业网络架构,专有云往往与互联网完全隔离。大型企业往往只有DMZ区域才能与互联网通信,而且还需要在出口防火墙进行进口、出口的限制。

本文以阿里云DataWorks产品举例,其他云产品连接互联网数据库的方案基本相同。下图是笔者在某个专有云企业客户的实现方案:

1.png

方案的本质:

利用企业DMZ区(可以通过出口防火墙连接到互联网)服务器搭建nginx,然后将专有云DataWorks连接互联网数据库的请求进行4层IP/TCP反向代理,实现专有云内网产品连接互联网数据库。

Nginx的具体配置:

假设目标数据库是mysql数据库(123.234.165.100:3306),部署nginx的服务器是10.123.250.221,配置监听3306端口。

nginx.conf配置文件的stream模块配置如下:

user  nginx;
worker_processes  2;  ##根据服务器的cpu核数确定worker_rlimit_nofile 2048;    ##根据链接并发度确定events {
    worker_connections  2048;     ##根据链接并发度确定}
stream {
    server {
            listen 3306so_keepalive=on;    ## 监听port2端口,并且开启keepalive连接。            proxy_pass 123.234.165.100:3306;  ## 所有请求IP2:port2的4层网络包都转发到IP1:port1       }
}
## http {## http 7层代理和stream 4层代理是平行关系,可以同时配置实现4层/7层代理。## }

 

2.2 公有云平台访问企业内网IDC数据库

在某些零售、新零售、新金融、游戏、电商等企业,往往不需要部署专有云,公有云完善的产品体系、简便的运维体系,更适合这类企业。这类企业在内网IDC机房(往往租借运营商的IDC)还部署了内网业务系统。

企业在公有云采购了云产品,比如Maxcompute+DataWorks搭建了大数据系统。需要定时采集内网IDC业务系统的数据库,进行离线、准实时、实时数据分析。虽然企业可以通过拉专线将企业内网IDC与公有云VPC网络打通,但是无法直接将企业内网IDC与公有云厂商经典网络打通(除了ECS、rds等少数产品在公有云VPC网络,大部分云产品都在公有云厂商经典网络,包括大数据类产品)。

本文以公有云DataWorks拉取客户内网IDC数据库数据场景为例,对于这类需求,采用以下nginx反向代理方案:

2.png

 

方案本质是利用三个原理:

(1)阿里云公有云的经典网络(比如DataWorks产品所在的网络)与VPC网络(ECS虚拟机所在的网络)之间采用tunnal机制,已经打通。因此,DataWorks可以访问ECS。

(2)阿里云VPC可以与客户内网IDC采用专线打通。阿里云专线产品、vpn网关这两个产品提供了网络打通的功能。

(3)将DataWorks连接的目标数据库IP/port指向ECS IP/port,然后ECS部署的nginx可以将数据库连接反向代理到IDC机房。

Nginx的具体配置:

假设目标数据库是oracle数据库(192.168.250.199:1521),部署nginx的服务器是10.123.250.221,配置监听1521端口。

nginx.conf配置文件的stream模块配置如下:

user  nginx;
worker_processes  2;  ##根据服务器的cpu核数确定worker_rlimit_nofile 2048;    ##根据链接并发度确定events {
    worker_connections  2048;     ##根据链接并发度确定}
stream {
    server {
            listen 1521so_keepalive=on;    ## 监听port2端口,并且开启keepalive连接。            proxy_pass 192.168.250.199:1521;    ## 所有请求IP2:port2的4层网络包都转发到IP1:port1            proxy_timeout 72h;
       }
}
## http {## http 7层代理和stream 4层代理是平行关系,可以同时配置实现4层/7层代理。## }

 

三、7层nginx 代理的典型应用场景

Nginx 7层http代理的典型场景:内网专有云需要访问互联网资源。笔者在客户现场,遇到两个需求:

(1)阿里云专有云无法连通互联网,导致ECS虚拟机无法使用yum源部署程序。即使可以在内网搭建yum源,但是由于客户现场使用的操作系统版本特别多(centos、龙蜥操作系统、alios等,而且7.x\8.x等版本众多),依靠搭建内网yum源太麻烦。并且,内网yum源无法与公网yum源实时更新。

(2)专有云需要升级,需要从阿里官网下载安装包。安装包特别大(若干TB),手工使用硬盘下载然后传到阿里云内网太麻烦。

(3)专有云ECS部署了业务系统(比如OA系统),需要访问业主部门在互联网的官网系统。

针对这些需求,可以使用正向代理软件。但是客户不答应使用正向代理,担心正向代理放大了互联网访问目标范围。希望使用反向代理,针对每一个需求单独配置明确的代理规则,并开启访问日志进行访问审计。

以下是笔者设计的方案:

3.png

 

方案的本质:

利用企业DMZ区域(可以通过出口防火墙连接到互联网)服务器搭建nginx,然后根据访问的目标域名后缀规则,nginx配置不同的location匹配条件,进而代理转发到不同的目标域名。当然,为了实现nginx代理7层目标域名,需要在源端ECS服务器配置本地hosts,使得访问的目标域名被dns解析到DMZ区部署nginx的服务器IP。

假设:
1、DMZ区域服务器的IP地址是 10.123.251.240

2、目标访问域名有三个,分别是:

(1) 阿里云官网yum源:http://mirrors.aliyun.com/anolis*******

(2) 阿里云专有云升级包下载源:http://private-cloud-package.oss-xxxxxxx.com/release*******

(3) 客户官网地址:http://www.xxxx.com.cn/xxxx/index.html

备注:为了实现nginx的7层http代理,在源头ECS服务器必须将目标域名在/etc/hosts文件配置本地dns域名IP解析。也就是将上述的三个域名:mirrors.aliyun.com、private-cloud-package.oss-xxxxxxx.com、www.xxxx.com.cn在ECS的/etc/hosts文件解析成DMZ区的nginx部署服务器IP。这样才能使得源端ECS将目标域名访问请求包发送到nginx,让DMZ区服务器部署的nginx将请求代理转发到外网目标域名。

配置nginx7层代理,通常采用location机制实现域名后缀和参数的识别,进而将反向代理请求转发到不同的目标域名。location非常强大,可以实现以下几种优先级的匹配规则:

1、=:精确匹配

2、^~:最佳匹配

3、~ :正则表达式要区分大小写

4、~* :正则表达式不区分大小写

5、/ 开头:通用匹配

优先级:(location =精确匹配) > (location 完整路径匹配) > (location ^~ 最佳匹配路径) > (location ~,~* 正则匹配) > (location 部分起始路径) > (/)

 

Nginx的具体配置:

user nginx;
worker_processes auto;    ## 根据服务器的cpu核数确定error_log /var/log/nginx/error.log;  ## 审计error日志目录。需要根据你部署的nginx日志目录配置pid /run/nginx.pid;   ## 需要根据你部署的nginx日志目录配置include /usr/share/nginx/modules/*.conf;   ## 需要根据你部署的nginx日志目录配置events {
    worker_connections 2048;  ## 根据并发量配置,一般为1024的倍数}
http {
    log_format  main  '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_referer" ''"$http_user_agent" "$http_x_forwarded_for"';
    access_log  /var/log/nginx/access.log  main;   ## 审计error日志目录。需要根据你部署的nginx日志目录配置## keepalive_timeout   65;   ## keepalive的超时时间,建议不配置,采用默认的超时时间    include             /etc/nginx/mime.types;   ## 需要根据你部署的nginx日志目录配置## default_type        application/octet-stream;      server {
        listen       80;   ## 自己决定nginx监听的端口        server_name  10.123.251.240;   ## server_name 配置DMZ区服务器的IP地址        location  ^~/release {    ## location 最佳匹配 /release,用于代理转发到专有云下载地址            proxy_pass http://private-cloud-package.oss-xxxxxxx.com;
        }        
        location  /anolis {  ## location 通用匹配 /anolis,用于代理转发到龙蜥操作系统的yum源            proxy_pass http://mirrors.aliyun.com;
        }
        location  =/xxxx/index.html {  ## location 精确匹配 /xxxx/index.html,用于代理转发到客户官网            proxy_pass http://www.xxxx.com.cn;
        }
## 配置其他location规则,用于匹配域名后缀,进而proxy_pass转发到相应的目标域名    }
}

location由于强大的匹配规则,可以在同一个nginx  server配置成百上千的转发规则,实现成百上千的外部域名代理需求。笔者曾经使用1个nginx  server配置了五百多个外部域名转发,满足整个企业的外部域名访问需求,并且针对nginx日志开发了审计程序,对每一个内网业务访问外网域名的访问记录实现了安全审计功能。

四、后记

Nginx 代理功能非常强大,可以实现多种场景下的简单/复杂代理需求的4层TCP/UDP和7层http代理。感兴趣的读者,建议后续在工作中遇到代理转发需求,都考虑使用nginx实现代理转发需求。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 课程目标  通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者
相关文章
|
1月前
|
应用服务中间件 nginx Docker
本地通过域名访问虚拟机上nginx的服务、搭建域名访问环境一(反向代理配置)
这篇文章介绍了如何通过域名在本地访问虚拟机上的nginx服务,包括创建nginx容器、修改配置文件、修改本地host文件以及进行访问测试的详细步骤。文章提供了具体的Docker命令来创建并配置nginx容器,展示了配置文件的修改示例,说明了如何在本地系统的hosts文件中添加虚拟机IP和自定义域名,以及如何通过浏览器进行测试访问。
本地通过域名访问虚拟机上nginx的服务、搭建域名访问环境一(反向代理配置)
|
24天前
|
负载均衡 应用服务中间件 网络安全
Django后端架构开发:Nginx服务优化实践
Django后端架构开发:Nginx服务优化实践
35 2
|
27天前
|
缓存 负载均衡 应用服务中间件
Nginx 代理管理器强势登场!轻松设置反向代理,为你的网络安全与高效护航,快来探索!
【8月更文挑战第23天】Nginx 代理管理器(NPM)是一款强大的工具,用于简化反向代理的设置流程。反向代理能隐藏后端服务器的真实IP,提升安全性,实现负载均衡与缓存等功能。用户需先安装Nginx 代理管理器,然后通过其Web界面添加代理主机,指定代理名称、协议类型、服务器地址及端口等信息。对于HTTPS协议,还需上传SSL证书/密钥。完成设置后,可通过浏览器测试反向代理是否正常工作。Nginx 代理管理器还支持高级特性,如负载均衡、缓存及访问控制等。
49 1
|
28天前
|
缓存 负载均衡 应用服务中间件
【揭秘】nginx代理配置全攻略:从零到精通,一文带你玩转高效网络代理的秘密武器!
【8月更文挑战第22天】nginx是一款高性能的HTTP与反向代理服务器,支持代理服务、负载均衡及缓存等功能,有助于提升网站响应速度和安全性。首先需确保已安装nginx,可通过包管理器进行安装。安装后启动并确认nginx运行状态。接着编辑配置文件(通常位于`/etc/nginx/nginx.conf`),设置代理转发规则,例如指定目标服务器地址和请求头信息。配置完成后测试有效性并重新加载nginx以应用更改。可以通过部署简易HTTP服务器验证代理功能是否正常工作。此外,还可以通过扩展配置文件实现更复杂的代理需求,如基于路径的代理和SSL加密等。
161 2
|
1月前
|
关系型数据库 应用服务中间件 PHP
如何在 Ubuntu 16.04 上使用 Nginx 部署 Laravel 应用
如何在 Ubuntu 16.04 上使用 Nginx 部署 Laravel 应用
18 1
|
1月前
|
缓存 Ubuntu 前端开发
在Ubuntu上手动与自动启动Nginx的踩坑经历、以及重启服务
本文分享了作者在Ubuntu系统上手动和自动启动Nginx服务的踩坑经历,包括创建启动脚本、解决依赖问题、配置服务自动启动以及通过命令行管理Nginx服务的方法。
161 0
在Ubuntu上手动与自动启动Nginx的踩坑经历、以及重启服务
|
21天前
|
安全 JavaScript 前端开发
Nginx服务扫描漏洞修复
Nginx服务扫描漏洞修复
|
27天前
|
应用服务中间件 Linux nginx
在Linux中,如何让某个服务(假如服务名为 nginx)只在3,5两个运⾏级别开启,其他级别关闭?
在Linux中,如何让某个服务(假如服务名为 nginx)只在3,5两个运⾏级别开启,其他级别关闭?
|
29天前
|
Ubuntu 应用服务中间件 Linux
在Linux中,如何查看Apache或Nginx服务的状态?
在Linux中,如何查看Apache或Nginx服务的状态?
|
1月前
|
JavaScript 网络协议 前端开发
如何在单个VPS上使用nginx、forever和crontab托管多个Node.js应用
如何在单个VPS上使用nginx、forever和crontab托管多个Node.js应用
17 0