【从入门到放弃-Kubernetes】Kubernetes进阶-pod水平自动伸缩(hpa)-阿里云开发者社区

【从入门到放弃-Kubernetes】Kubernetes进阶-pod水平自动伸缩(hpa)

2020-06-04 1654

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

前言

前面 Kubernetes入门系列，我们学习了k8s的基础知识和简单用法，今天开始我们继续进一步学习，了解一些复杂和高级用法。本文我们学习pod水平自动扩缩容即hpa。
hpa全称是Horizontal Pod Autoscaler，可以基于CPU的利用率或其它指标自动伸缩replication controller、deployment和 replica set 中的 pod 数量。
我们可以根据标准应用系统的CPU等指标的周期性变化情况，通过HPA进行动态扩缩容以此来提高集群的资源利用率。

准备

hpa通过metrics-server，监控集群运行指标触发扩缩容的，使用前需要先确保metrics-server是可用状态。

minikube addons list

观察metrics-server是否是可用状态，如果是disabled。则需要执行以下命令开启。

minikube addons enable metrics-server

此时执行kubectl top命令即可查看pod、node的cpu、memory的使用消耗情况。

如果想禁用metrics-server，disable即可

minikube addons disable metrics-server

启动应用并暴露服务

我们参考官方demo，使用PHP提供http服务，进行CPU密集型计算。观察CPU和pod自动扩缩容情况。

准备镜像

这里创建一个CPU密集型PHP脚本，并打成镜像。

也可以直接用我打好的镜像 registry.cn-hangzhou.aliyuncs.com/larswang/php-hpa:1.0，跳过这一步，直接看Deployment。

文件及源码地址见：AloofJr

# Dockerfile
FROM php:7.4.6-apache
ADD index.php /var/www/html/index.php
RUN chmod a+rx index.php

// index.php
<?php
  $x = 0.0001;
  for ($i = 0; $i <= 1000000; $i++) {
    $x += sqrt($x);
  }
  echo "OK!";
?>

Deployment

apiVersion: apps/v1
kind: Deployment
metadata:
  name: php-hpa-deployment
  labels:
    app: php-hpa
spec:
  replicas: 1
  selector:
    matchLabels:
      app: php-hpa
  template:
    metadata:
      labels:
        app: php-hpa
    spec:
      containers:
      - name: php-hpa
        image: registry.cn-hangzhou.aliyuncs.com/larswang/php-hpa:1.0
        ports:
        - containerPort: 80
        resources:
          requests:
            cpu: 200m

Service 暴露服务

apiVersion: v1
kind: Service
metadata:
  name: php-hpa-service
spec:
  type: ClusterIP
  selector:
    app: php-hpa
  ports:
    - port: 80

HPA

创建HPA

创建hpa设置pod扩缩最多和最少的数量以及执行扩缩容的条件。

apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
  name: php-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: php-hpa-deployment
  minReplicas: 1 #pod最小数量
  maxReplicas: 10 #pod最大数量
  targetCPUUtilizationPercentage: 10 #cpu使用率超过10%进行扩容，小于10%缩容

观察HPA运行情况

kubectl get hpa

可以看到以下指标
TARGETS：目前CPU使用率是0%，10%是我们设置的扩缩容阙值。
MINPODS：pod最小数量
MAXPODS：pod最大数量
REPLICAS：当前副本数，因为我们的cpu使用率是0%，当前副本数是1。

增加负载

我们使用busybox，不断的对php-hpa-service发起http调用，增加服务端压力。

# 使用busybox并进入容器
kubectl run  -i --rm  --tty load-generator --image=busybox /bin/sh

# 不断发起http请求
while true; do wget -q -O- http://php-hpa-service; done

查看hpa情况

cpu利用率143%了，此时REPLICAS还是1，再等一会儿

可以看到REPLICAS已经扩到了10个pod，cpu负载平均到了35%，虽然比我们配置的10%高，但是扩到了最多MAXPODS 10个，所以不会继续扩容了

降低负载

停掉load-generator发压，等几分钟（可以通过--horizontal-pod-autoscaler-downscale-stabilization设置缩容冷却时间，默认五分钟）。

可以看到REPLICAS缩到了1个pod。

总结

上面介绍了根据CPU利用率进行HPA的操作，其实在实际工作中，HPA是一个非常复杂的课题，因为影响应用运行状态的不单单是CPU，会和内存、ERROR数、线程数等多项指标相关。

在扩容时，还要考虑资源额度、数据库连接数等。

在缩容时则需要更小心了，要时刻关注应用的运行状态，是很容易引发容量故障的。

更复杂的还有，应用系统是否非标、是CPU密集型还是内存密集型应用、系统的流量变化周期、如何应对突发流量等等。

欢迎感兴趣或有实战经验的大神们来交流探讨。

文件用到的yaml配置可以在AloofJr找到。

【从入门到放弃-Kubernetes】Kubernetes进阶-pod水平自动伸缩(hpa)

前言

准备

启动应用并暴露服务

准备镜像

Deployment

Service 暴露服务

HPA

创建HPA

观察HPA运行情况

增加负载

降低负载

总结

更多文章

Java技术进阶

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

【从入门到放弃-Kubernetes】Kubernetes进阶-pod水平自动伸缩(hpa)

前言

准备

启动应用并暴露服务

准备镜像

Deployment

Service 暴露服务

HPA

创建HPA

观察HPA运行情况

增加负载

降低负载

总结

更多文章

Java技术进阶

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像