企业运维训练营之云上网络原理与实践 — 第六讲 云服务与总结

本文涉及的产品
传统型负载均衡 CLB,每月750个小时 15LCU
网络型负载均衡 NLB,每月750个小时 15LCU
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 课程目标 • 了解Privatelink产品架构与最佳实践• 通过Privatelink理解云上网络问题排查方法• 理解问题排查方法论• 回顾本期训练营内容

企业运维训练营之云上网络原理与实践

第六讲 云服务与总结

 

视频地址:

https://developer.aliyun.com/learning/course/991/detail/14991

 

课程目标

 

  • 了解Privatelink产品架构与最佳实践
  • 通过Privatelink理解云上网络问题排查方法
  • 理解问题排查方法论
  • 回顾本期训练营内容

 

课程目录

 

  • Privatelink相关概念与产品功能
  • Privatelink问题排查方法
  • 问题排查方法论
  • 回顾本期训练营内容

 

正文:

 

一、Privatelink相关概念与产品功能

 

1.  Privatelink - 不破坏网络边界的基础上提供云服务。

 

什么是网络边界?先来回顾一下云网络发展的几个阶段:

 image.png

 

a.   经典网络时代

 

  • 没有独立网络空间,没有网络边界;

 

b.   单体云网络时代

 

  • 基于对等连接的单点组网:实现云上独立地址空间,但仅限于VPC间两两互通,VPC之间有严格的网络边界;
  • 基于CEN/CEN-TR的“全球一张网”:解决多VPC复杂组网问题,每个VPC或组网都有自己的边界;

 

c.   服务化云网络时代:

 

自治网络组织A、组织B、组织C……均具有独立的网络边界,因各种原因无法直接连接,而通过Privatelink产品可以实现相互访问,亦即:

  • 基于Privatelink的服务化组网,解决多张网问题;
  • 解决集团型企业组网,实现云上企业生态互联;

 

2.  Privatelink产品简介

 

私网连接(Privatelink)是利用阿里云的私有网络进行服务交互的一种方式。

 image.png

 

如上图所示,利用私网连接,用户可以通过私有网络,单向访问部署在其它 VPC中的服务,无需创建NAT网络、EIP等公网出口,交互数据不会经过互联网,有更高的安全性和更好的网络质量。

 

Privatelink的产品特点:

 

  • 本地私网通信;
  • 保持网络封闭;
  • 单向服务访问;
  • 保持双方网络独立。

 

3.  Privatelink使用场景

 

Privatelink的使用场景主要有:云服务、企业内部服务和云上企业生态。

 image.png

Privatelink使用场景

 

a.   云服务

 

场景描述:客户需要以独立的接口访问云内的服务,可以在客户的VPC中创建Endpoint(终端节点),并提供终端节点服务,客户的接口只需访问终端节点,就可以与云服务互通。

 

Privatelink的优势:

 

  • 更加安全可控的云服务入口;
  • 支持跨地域访问云服务;
  • 支持IDC访问云服;

 

b.   企业内部服务

 

场景描述:企业内部不同网络业务层和公共服务层的互通,通过独立的网络规划访问公共服务器区,可以在业务账户内部各创建一个Endpoint,在服务账号VPC中创建Endpoint服务并绑定SLB,即可在企业内部提供公共服务。

 

Privatelink的优势:

 

  • 支持服务化的企业IT架构;
  • 支持单账号和多账号体系;
  • 服务方和业务方的网络规划各自独立,简化管理;
  • 更高的安全管控能力和安全隔离能力;

 

c.   云上企业生态

 

场景描述:企业与ISV(企业服务合作方)之间的互通场景,每个企业会有多个ISV,同时每个ISV也会对接多个企业,为了防止网段冲突,通过私网连接,ISV向每个企业提供独立的私网接口进行连接。

 

Privatelink的优势:

 

  • ISV和企业能够在私有网络中发布和使用服务;
  • 全程私有网络通信,数据不经过互联网,更加安全可靠;
  • 支持混合云场景下的服务发布和访问;

 

4.  Privatelink产品组成

 image.png

Privatelink产品组成

 

Privatelink产品主要包含以下组件:

 

a.   终端节点(Endpoint):代表某个云上服务的使用方VPC中的私有连接接入点。终端节点通过终端节点网卡接入到某个可用区的虚拟交换机。创建终端节点时,可以根据终端节点服务名称,发起连接到服务提供方的终端节点服务的连接请求;

 

b.   终端节点可用区和网卡(Endpoint Zone & ENI):代表了服务使用方VPC中的服务请求入口。终端节点网卡是在服务使用方VPC中某个虚拟交换机中的一个弹性网卡(ENI),会占用虚拟交换机网段中的一个私网IP地址。所有发送到这个弹性网卡地址的服务请求将会通过私有连接转发到对应服务提供方在相同可用区的服务资源;

 

c.   终端节点服务(Endpoint Service):代表了服务提供方通过私有连接提供的对外服务,服务名称是唯一标识,服务提供方可以管理服务使用方发起的连接请求。终端节点服务可以添加部署在多个可用区的SLB应用服务集群作为服务资源;

 

d.   服务资源(Service Resource):即实际提供服务的集群。目前私网连接支持使用SLB作为服务资源;

 

e.   终端节点连接(Endpoint Connection):代表了终端节点和终端节点服务之间的连接。服务使用方创建终端节点时将发起到终端节点服务的连接请求,服务提供方可以自动或手动接收连接请求;

 

注意:

  • 一个终端节点在一个可用区中只能有一个终端节点网卡;
  • 某个终端节点网卡的流量只会转发到在相同可用区的SLB服务集群。

 

5.  多可用区高可用能力

image.png

 

a.   故障场景

 

  • 某个可用区/机房的PVL集群全部宕机;
  • 整个可用区/机房出现故障;
  • 某个可用区的服务提供方的服务资源不可用;

 

b.   高可用机制:通过域名解析实现多可用区高可用

 

  • 对多个可用区中ENI的服务状态进行健康检查;
  • 当某个可用区的服务不可用(包括故障场景中的3种情况),自动将不可用的ENI IP从解析结果中去除;
  • 客户端根据更新的DNS解析结果,将请求发送到可用的ENI IP

 

c.   客户侧要求:客户端必须使用服务的VPC域名访问服务,不能直接使用可用区域名或者ENI IP

image.png

 

二、通过Privatelink理解云上网络问题排查方法

 

案例:北京VPC内的ECS无法访问到上海Privatelink

 

1.  问题排查:

 image.png

物理拓扑图

 

进行问题排查,首先要从物理拓扑图(上图)中抽象出一个逻辑拓扑(下图):

 image.png

逻辑拓扑图

 

在这张图中,从ClinetPrivatelink EP ENI是客户端,后面三个是服务提供商。在问题排查中,可以先在客户端链路进行自查,确定问题出现的大方向,再详细定位问题。

 

2.  问题分析

 

枚举在抽象的逻辑图中每个节点可能出现的情况:

 

a.   客户端(Client

 

  • 安全组;
  • 安全策略;
  • 容器网段;

 

b.   VPC1 & VPC2

 

  • NACL
  • 路由问题;

 

c.   CEN

 

  • TR路由表;
  • 带宽包配置;
  • 带宽包使用率;

 

d.   EP ENI

 

  • 安全组;

 

e.   EP Service

 

  • 是否正确连接;

 

f.   CLB

 

  • 健康检查情况;
  • 连接数上限;
  • QPS上限;

 

g.   RS

 

  • 规格上限;
  • 内核丢包;
  • 应用配置;

 image.png

 

三、问题排查方法论

 

1.  Drill-Down Analysis Method - 从错误本身逐层剖析

 

细节决定成败,这种方法就是对问题现象深挖到底,实施起来需要多个领域的专业知识,非常有挑战性。

 

  • Start at highest level,通常从应用报错日志开始;
  • Examine next-level details,从应用层、容器网络层、内核层、虚拟化层逐层怀疑;
  • Pick most interesting breakdown,排查可疑的现象;
  • If problem unsolvedgo to 2,如果问题没有解决则再回到第二步;

 

优点:通过逐层排查,可以清晰而细致的剖析问题;

 

缺点:

  • 排查依赖于异常复现,需要排查人员对各领域有丰富的经验;
  • 容易困在一个很小的点里,而忽视全局。

 

2.  Tools Method - 从外围监控入手

 

成大事者不拘小节,这种方法是从整个系统监控指标看问题,而不只限于错误消息。

 

  • 首先应有怀疑的方向,并了解对应方向的工具;
  • 了解工具暴露的哪些指标可以佐证自己的怀疑;
  • 明确指标的含义;
  • 执行选择的工具并说明指标的含义Run selected tools and interpret selected metrics

 

缺点:

  • 如果是偶现的、或历史的异常,监控指标可能不全;
  • 生产环境需要部署大量的监控软件,适用场景有限。

 

四、回顾本期训练营

 

本期《企业运维训练营之云上网络原理与实践》主要讲解了三部分内容:阿里云云网络的发展、云上网络产品、以及问题排查的方法论和工具。

 

阿里云云网络发展历经四个阶段,从经典网络到安全隔离的专有网络VPC,进而通过云企业网进入全球互联,最后到5G/IOT的万物互联。

 

云上网络产品主要介绍了VPC、负载均衡CLBALBNATEIPCENPrivatelink

 

问题排查方法主要推荐两种,从错误本身出发和从外围监控出发,两种方法各有利弊,视根据具体情况选择。

 

问题排查工具主要有:mtr/traceroute/winmtr/tracertpingWireshark等等。

image.png

相关文章
|
12天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习的奥秘:探索神经网络的核心原理
本文将深入浅出地介绍深度学习的基本概念,包括神经网络的结构、工作原理以及训练过程。我们将从最初的感知机模型出发,逐步深入到现代复杂的深度网络架构,并探讨如何通过反向传播算法优化网络权重。文章旨在为初学者提供一个清晰的深度学习入门指南,同时为有经验的研究者回顾和巩固基础知识。
35 11
|
30天前
|
运维 监控 Devops
DevOps文化下的企业运维转型
【8月更文挑战第22天】在数字化转型的浪潮中,DevOps不仅仅是一种技术实践,更是一种企业文化。本文将探讨如何在DevOps文化的引导下,实现企业运维的高效转型,包括理念更新、流程优化和团队协作等方面。我们将一起思考如何打破传统壁垒,构建一个更加灵活、高效和协同的运维体系,以应对不断变化的市场和技术挑战。
33 1
|
8天前
|
运维 Cloud Native Devops
云原生架构的崛起与实践云原生架构是一种通过容器化、微服务和DevOps等技术手段,帮助应用系统实现敏捷部署、弹性扩展和高效运维的技术理念。本文将探讨云原生的概念、核心技术以及其在企业中的应用实践,揭示云原生如何成为现代软件开发和运营的主流方式。##
云原生架构是现代IT领域的一场革命,它依托于容器化、微服务和DevOps等核心技术,旨在解决传统架构在应对复杂业务需求时的不足。通过采用云原生方法,企业可以实现敏捷部署、弹性扩展和高效运维,从而大幅提升开发效率和系统可靠性。本文详细阐述了云原生的核心概念、主要技术和实际应用案例,并探讨了企业在实施云原生过程中的挑战与解决方案。无论是正在转型的传统企业,还是寻求创新的互联网企业,云原生都提供了一条实现高效能、高灵活性和高可靠性的技术路径。 ##
18 3
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
深度剖析深度神经网络(DNN):原理、实现与应用
本文详细介绍了深度神经网络(DNN)的基本原理、核心算法及其具体操作步骤。DNN作为一种重要的人工智能工具,通过多层次的特征学习和权重调节,实现了复杂任务的高效解决。文章通过理论讲解与代码演示相结合的方式,帮助读者理解DNN的工作机制及实际应用。
|
7天前
|
网络协议 Linux 应用服务中间件
Socket通信之网络协议基本原理
【9月更文挑战第14天】网络协议是机器间交流的约定格式,确保信息准确传达。主要模型有OSI七层与TCP/IP模型,通过分层简化复杂网络环境。IP地址全局定位设备,MAC地址则在本地网络中定位。网络分层后,数据包层层封装,经由不同层次协议处理,最终通过Socket系统调用在应用层解析和响应。
|
8天前
|
网络协议 网络架构 数据格式
TCP/IP基础:工作原理、协议栈与网络层
TCP/IP(传输控制协议/互联网协议)是互联网通信的基础协议,支持数据传输和网络连接。本文详细阐述了其工作原理、协议栈构成及网络层功能。TCP/IP采用客户端/服务器模型,通过四个层次——应用层、传输层、网络层和数据链路层,确保数据可靠传输。网络层负责IP寻址、路由选择、分片重组及数据包传输,是TCP/IP的核心部分。理解TCP/IP有助于深入掌握互联网底层机制。
35 2
|
4天前
|
运维 监控 安全
高效运维管理:提升企业IT系统稳定性与性能
在当今信息化时代,高效的运维管理对于企业IT系统的稳定性和性能至关重要。本文将探讨如何通过优化运维流程、引入自动化工具和建立完善的监控体系等措施,实现高效运维管理,从而提升企业的核心竞争力。
|
20天前
|
存储 监控 安全
|
20天前
|
机器学习/深度学习 人工智能 TensorFlow
深度学习中的卷积神经网络(CNN)原理与实践
【8月更文挑战第31天】在人工智能的浪潮中,深度学习技术以其强大的数据处理能力脱颖而出。本文将深入浅出地探讨卷积神经网络(CNN)这一核心组件,解析其在图像识别等领域的应用原理,并通过Python代码示例带领读者步入实践。我们将从CNN的基本概念出发,逐步深入到架构设计,最后通过一个简易项目展示如何将理论应用于实际问题解决。无论你是深度学习的初学者还是希望深化理解的实践者,这篇文章都将为你提供有价值的洞见和指导。
|
25天前
|
网络协议 Linux 应用服务中间件
Socket通信之网络协议基本原理
【8月更文挑战第27天】网络协议定义了机器间通信的标准格式,确保信息准确无损地传输。主要分为两种模型:OSI七层模型与TCP/IP模型。