负载均衡常见问题之会话保持-粘滞会话(Sticky Sessions)

本文涉及的产品
传统型负载均衡 CLB,每月750个小时 15LCU
网络型负载均衡 NLB,每月750个小时 15LCU
应用型负载均衡 ALB,每月750个小时 15LCU
简介:

会话保持是负载均衡最常见的问题之一,也是一个相对比较复杂的问题。


会话保持有时候又叫做粘滞会话(Sticky Sessions)。


在介绍会话保持技术之前,我们必须先花点时间弄清楚一些概念:什么是连接(Connection)、什么是会话(Session),以及这二者之间的区别。需要特别强调的是,如果我们仅仅是谈论负载均衡,会话和连接往往具有相同的含义。


从简单的角度来看,


如果用户需要登录,那么就可以简单的理解为会话;


如果不需要登录,那么就是连接。


实际上,会话保持机制与负载均衡的基本功能是完全矛盾的。负载均衡希望将来自客户端的连接、请求均衡的转发至后端的多台服务器,以避免单台服务器负载过高;而会话保持机制却要求将某些请求转发至同一台服务器进行处理。因此,在实际的部署环境中,我们要根据应用环境的特点,选择适当的会话保持机制。



原始负载均衡的基本原理


对于同一个连接中的数据包,负载均衡会将其进行NAT转换后,转发至后端固定的服务器进行处理,这是负载均衡最基本、最原始的功能。负载均衡系统内部会专门有一张表来记录这些连接的状况,包括:[源IP:端口]、[目的IP:端口]、[服务器IP:端口]、空闲超时时间(Idle Timeout)等等。


由于负载均衡内部记录连接状态的这张表需要消耗系统的内存资源,因此,这张表不可能无限大,所有厂家都会有一定的限制。这张表的大小一般称之为最大并发连接数,也就是系统同时能够容纳的连接数量。考虑到建立这些连接的客户端或服务器会发生一些异常状况,导致这些连接不能被正常终结掉,因此,负载均衡的当前连接状态表项中,设计了一个空闲超时时间的参数。这个参数定义为,当该连接在一定时间内无流量通过时,负载均衡会自动删除该连接条目,释放系统资源。


看了这段文字之后,应该就能够很好的理解为什么负载均衡的硬件设备的发展速度,无法和软件的发展相比较。因为这个硬件的发展速度,比不上服务器的发展速度….



有了会话之后,使用原始的负载均衡就会有问题,常见的异常场景包括:


1.        客户端输入了正确的用户名和口令,但却反复跳到登录页面;


2.        用户输入了正确的验证码,但是总提示验证码错误;


3.        客户端放入购物篮的物品丢失


4.        …


因此,会话保持机制的意义就在于,确保将来自相同客户端的请求,转发至后端相同的服务器进行处理。换句话说,就是将客户端与服务器之间建立的多个连接,都发送到相同的服务器进行处理。如果在客户端和服务器之间部署了负载均衡设备,很有可能,这多个连接会被转发至不同的服务器进行处理。如果服务器之间没有会话信息的同步机制,会导致其他服务器无法识别用户身份,造成用户在和应用系统发生交互时出现异常。



在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中,一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成由于这几次交互过程是密切相关的,服务器在进行这些交互过程的某一个交互步骤时,往往需要了解上一次交互过程的处理结果,或者上几步的交互过程结果,服务器进行下一步操作时需要这就要求所有这些相关的交互过程都由一台服务器完成,而不能被负载均衡器分散到不同的服务器上



而这一系列的相关的交互过程可能是由客户到服务器的一个连接的多次会话完成,也可能是在客户与服务器之间的多个不同连接里的多次会话完成不同连接的多次会话,最典型的例子就是基于http的访问,一个客户完成一笔交易可能需多次点击,而一个新的点击产生的请求,可能会重用上一次点击建立起来的连接,也可能是一个新建的连接



会话保持就是指在负载均衡器上有这么一种机制,可以识别做客户与服务器之间交互过程的关连性,在作负载均衡的同时,还保证一系列相关连的访问请求会保持分配到一台服务器上



简单会话保持



简单会话保持也被称为基于源地址的会话保持,也叫基于IP的会话保持,是指负载均衡器在作负载均衡时是根据访问请求的源地址作为判断关连会话的依据对来自同一IP地址的所有访问请求在作负载均时都会被保持到一台服务器上去在BIGIP设备上可以为“同一IP地址"通过网络掩码进行区分,比如可以通过对IP地址 192.168.1.1进行255.255.255.0的网络掩码,这样只要是来自于192.168.1.0/24这个网段的流量BIGIP都可以认为他们是来自于同一个用户,这样就将把来自于192.168.1.0/24网段的流量会话保持到特定的一台服务器上



简单会话保持里另外一个很重要的参数就是连接超时值,BIGIP会为每一个进行会话保持的会话设定一个时间值,当一个会话上一次完成到这个会话下次再来之前的间隔如果小于这个超时值,BIGIP将会将新的连接进行会话保持,但如果这个间隔大于该超时值,BIGIP将会将新来的连接认为是新的会话然后进行负载平衡


注意:会话保持时间和连接保持时间不一样



简单会话保持实现起来简单,只需要根据数据包三四层的信息就可以实现,效率也比较高



F5对会话保持的支持



F5 BigIP支持多种的会话保持方法,其中包括:简单会话保持(源地址会话保持)HTTP Header的会话保持,基于SSL Session ID的会话保持,I-Rules会话保持以及基于 HTTP Cookie的会话保持,此外还有基于SIP ID以及Cache设备的会话保持等,但常用的是简单会话保持,HTTP Header的会话保持以及 HTTP Cookie会话保持以及基于I-Rules的会话保持




NginX对简单会话保持的支持


ip_hash

每个请求按访问ip的hash结果分配,这样每个访客固定访问一个后端服务器,可以解决session 的问题。

例如:

    upstream bakend {

        ip_hash;

        server 192.168.0.14:88;

        server 192.168.0.15:80;

    }


ip_hash算法的原理很简单,根据请求所属的客户端IP计算得到一个数值,然后把请求发往该数值对应的后端。所以同一个客户端的请求,都会发往同一台后端,除非该后端不可用了。ip_hash能够达到保持会话的效果。


ip_hash是基于round robin的,判断后端是否可用的方法是一样的。


简单会话保持存在的问题就在于当多个客户是通过代理或地址转换的方式来访问服务器时,由于都分配到同一台服务器上,会导致服务器之间的负载严重失衡另外一种情况上客户机数量很少,但每个客户机都会产生多个并发访问,对这些必发访问也要求通过负载均衡器分配到多个服器上,这时基于客户端源地址的会话保持方法也会导致负载均衡失效这个时候,就必须要考虑使用其他的会话保持方式,比如session等。


         如果使用硬件作为负载均衡设备,如果遇到一些特殊的情况,需要进行个性化定制,其实是非常有难度和挑战的,再更加多的时间,其实这是根本走不通的,如果使用软件,比如Nginx或者Apache,我们可以对它进行一定程度上的订制,尽可能多的满足业务要求。


         一些其他的会话保持的方法


使用数据库存放session


Session信息存储到数据库表,这样实现不同应用服务器间Session信息的共享。


1.   适合数据库访问量不大的网站


     优点:实现简单

     缺点:由于数据库服务器相对于应用服务器更难扩展且资源更为宝贵,在高并发的Web应用中,最大的性能瓶颈通常在于数据库服务器。因此如果将 Session存储到数据库表,频繁的数据库操作会影响业务。



使用文件系统存放session


        通过文件系统(比如NFS方式)来实现各台服务器间的Session共享,各台服务器只需要mount共享服务器的存储Session的磁盘即可,实现较为简单。但NFS 对高并发读写的性能并不高,在硬盘I/O性能和网络带宽上存在较大瓶颈,尤其是对于Session这样的小文件的频繁读写操作。


       适合并发量不大的网站.



基于浏览器Cookie的Session共享

      此种方案把用户相关的Session信息存储到浏览器的Cookie中,也称为客户端Session。

      采用Flash Cookie、URL重写的方式传递Session信息的方案也可以归为此类。

      缺点:只能够存储字符串、数值等基本类型的数据;Cookie大小存在限制;安全性;带宽及数据解压缩、网络传输性能问题。



基于Memcached 存储Session


利用Memcached来保存Session数据,直接通过内存的方式,效率自然能够提高不少。 在读写速度上会比 files 时快很多,而且在多个服务器需要共用 session 时会比较方便,将这些服务器都配置成使用同一组 memcached 服务器就可以,减少了额外的工作量。

缺点: session 数据都保存在 memory 中,一旦宕机,数据将会丢失。但对 session 数据来说并不是严重的问题。如果网站访问量太大,session太多的时候,memcached会将不常用的部分删除,但是如果用户隔离了一段时间之后继续使用,已经全部乱套了。



本文转自 Innocence_caosm 51CTO博客,原文链接:http://blog.51cto.com/innocence/1962931,如需转载请自行联系原作者

相关实践学习
SLB负载均衡实践
本场景通过使用阿里云负载均衡 SLB 以及对负载均衡 SLB 后端服务器 ECS 的权重进行修改,快速解决服务器响应速度慢的问题
负载均衡入门与产品使用指南
负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务,可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。 本课程主要介绍负载均衡的相关技术以及阿里云负载均衡产品的使用方法。
相关文章
|
6月前
|
域名解析 移动开发 负载均衡
阿里云DNS常见问题之DNS负载均衡调加权模式失败如何解决
阿里云DNS(Domain Name System)服务是一个高可用和可扩展的云端DNS服务,用于将域名转换为IP地址,从而让用户能够通过域名访问云端资源。以下是一些关于阿里云DNS服务的常见问题合集:
|
6月前
|
域名解析 负载均衡 监控
阿里云DNS常见问题之使用DNS实现负载均衡失败如何解决
阿里云DNS(Domain Name System)服务是一个高可用和可扩展的云端DNS服务,用于将域名转换为IP地址,从而让用户能够通过域名访问云端资源。以下是一些关于阿里云DNS服务的常见问题合集:
|
4天前
|
负载均衡 监控 算法
slb使用中常见问题
【10月更文挑战第23天】
18 5
|
6月前
|
存储 Kubernetes 应用服务中间件
容器服务ACK常见问题之SLB公网改成ALB失败如何解决
容器服务ACK(阿里云容器服务 Kubernetes 版)是阿里云提供的一种托管式Kubernetes服务,帮助用户轻松使用Kubernetes进行应用部署、管理和扩展。本汇总收集了容器服务ACK使用中的常见问题及答案,包括集群管理、应用部署、服务访问、网络配置、存储使用、安全保障等方面,旨在帮助用户快速解决使用过程中遇到的难题,提升容器管理和运维效率。
|
机器学习/深度学习 弹性计算 运维
《企业运维之云上网络原理与实践》——第二章 负载均衡 CLB——负载均衡CLB(下)-常见问题与解决思路(1)
《企业运维之云上网络原理与实践》——第二章 负载均衡 CLB——负载均衡CLB(下)-常见问题与解决思路(1)
305 0
|
弹性计算 运维 负载均衡
《企业运维之云上网络原理与实践》——第二章 负载均衡 CLB——负载均衡CLB(下)-常见问题与解决思路(2)
《企业运维之云上网络原理与实践》——第二章 负载均衡 CLB——负载均衡CLB(下)-常见问题与解决思路(2)
248 0
|
弹性计算 运维 负载均衡
《企业运维之云上网络原理与实践》——第二章 负载均衡 CLB——负载均衡CLB(下)-常见问题与解决思路(3)
《企业运维之云上网络原理与实践》——第二章 负载均衡 CLB——负载均衡CLB(下)-常见问题与解决思路(3)
166 0
|
负载均衡 算法 数据库
从银行柜台小姐姐聊负载均衡中的会话粘滞
从银行柜台小姐姐聊负载均衡中的会话粘滞
141 0
|
机器学习/深度学习 弹性计算 运维
企业运维训练营之云上网络原理与实践课程 - 第二讲 负载均衡CLB(下)- 常见问题与解决思路
课程目标 了解负载均衡CLB的产品功能 了解负载均衡CLB的底层架构与相关技术 掌握负载均衡CLB的最佳实践 熟知负载均衡CLB的常见问题与解决思路
企业运维训练营之云上网络原理与实践课程 - 第二讲  负载均衡CLB(下)- 常见问题与解决思路
|
负载均衡
负载均衡-会话保持cookie内容说明
负载均衡http监听采用植入cookie时,默认会加入一个cookie,他的具体含义是什么呢? SERVERID=abd77a4088910c05c7d6517601bb198d|1570633089|1570632657;Path=/" 其中SERVERID这个cookie是负载均衡内部使用,建...
1690 0
下一篇
无影云桌面