利用GPU性能指标进行弹性伸缩
随着人工智能大潮的风起云涌, 视频识别,语音识别,图像识别,自然语言翻译,AI画匠等基于GPU的在线预测也在遍地开花。而弹性伸缩对于人工智能服务来说尤为重要,一方面是业务压力峰值时巨大的计算力需求;另一方面当业务空闲时,GPU的空耗成本也是大家很难承受的。
基于微服务和Docker容器技术的PaaS云平台架构设计
本文讲的是基于微服务和Docker容器技术的PaaS云平台架构设计【编者的话】在系统架构上,PaaS云平台主要分为微服务架构、Docker容器技术、DveOps三部分,这篇文章重点介绍微服务架构的实施。
容器服务节点重启操作最佳实践
直接重启节点可能会导致集群出现异常。比如,对于 Swarm Mode 集群内的 Manager 节点,如果 Manager 健康节点数小于 2,则可能会导致集群无法自愈,最终导致集群不可用。本文结合阿里云历史案例经验,说明了在对容器服务进行主动运维等场景下,需要重启节点时的操作最佳实践。
Learn Jenkins the hard way (2) - Stapler与Jelly
## 前言 在上篇文章中,我们讨论了如何调试Jenkins的页面。今天我们将开始研究研究Jenkins的页面与路由机制。因为Stapler与Jelly的内容比较繁琐和复杂,暂定通过两篇文章来探讨。
DockOne微信分享(七十五):应用容器化之Kubernetes实践
本文讲的是DockOne微信分享(七十五):应用容器化之Kubernetes实践【编者的话】本次分享主要以ZooKeeper、Redis、Kafka、MongoDB等应用容器化在Kubernetes平台上面实践。
K8s学习进阶月刊第二期 阿里云亮相2019云原生产业大会,积极共建云原生生态
欢迎订阅K8s学习进阶月刊 视频干货资料尽情下载 阿里云应用性能管理(APM)产品-应用实时监控服务(ARMS)技术解密 资料下载直播大纲: 应用性能管理(APM)背景介绍 分布式链路追踪的现状与使用场景 ARMS分布式链路追踪的技术实现 最佳实践(1) 全息排查+场景链路 (2)前端监控与应.
阿里云Kubernetes CSI实践—CPFS存储卷使用
1. 前言 CPFS(Cloud Paralleled File System)是一种并行文件系统。CPFS 的数据存储在集群中的多个数据节点,并可由多个客户端同时访问,从而能够为大型高性能计算机集群提供高 IOPS、高吞吐、低时延的数据存储服务。
Kubernetes容器平台建设中,F5解决方案好不好?
近年来,随着OpenStack、Kubernetes等云技术的兴起,应用系统的微服务化、快速迭代对资源的弹性伸缩能力提出了更高的要求。基于多年在负载均衡领域的经验,Kubernetes容器平台建设中,F5解决方案好不好? F5推出了Kubernetes容器服务解决方案 前不久,民生银行在Kubernetes容器平台建设中,探索使用了一种灵活的软件F5解决方案,在利用F5传统优势的同时,也满足了容器应用的高灵活性要求。
[Kubernetes] 阿里云容器服务Kubernetes配置负载均衡HTTPS
在云端环境使用Kubernetes与SLB(负载均衡器)搭建HTTPS时,有多种实现的方式: 在SLB上配置HTTPS,SLB通过HTTP直接访问到集群内的具体服务(SLB负责处理HTTPS) 在SLB上配置TCP 443端口到Ingress的映射,SLB通过TCP将流量转发到Ingress,在.
Docker 1.13 新特性 —— Docker系统相关
Docker随着1.13版本的发布,Docker对Daemon的API和命令行做了一系列的改造,除了对容器,镜像等命令做了二级的命令(containers,images)的改造完,还增加了很多的系统或集群的管理的接口和命令,包含system,plugin,secret,分别用于管理Docker Daemon的系统状态,Docker插件的管理,以及集群中的敏感信息的管理。
DevOps的支撑服务:K8s容器管理与应用部署
本文讲的是DevOps的支撑服务:K8s容器管理与应用部署,大家好,本期微课堂介绍在新一代数字化企业云平台中对于Kubernetes的学习以及使用的总结。
阿里云容器服务DaemonSet实践
DaemonSet 保证在每个 Node 上都运行一个容器副本,常用来部署一些集群的日志、监控或者其他系统管理应用。下面以日志收集 fluentd 为例,看下如何使用阿里云容器服务控制台创建DaemonSet。 ### 准备Kubernetes环境 在阿里云容器服务控制台中创建Kubernetes 集群(1.11.5),3 master,3 worker ### 安装fluentd
【云栖大会】后APP时代的破局之路 :阿里技术“三大容器五大方案”亮相,百川开放全面升级
从移动中台的三大容器(Weex、H5、ATLAS),五大解决方案(快速交付解决方案、移动网络加速和消息解决方案、多媒体直播解决方案、APP性能监控解决方案、Weex/H5跨平台开发解决方案)角度来看,阿里提供能力的核心是重构移动研发模式,帮助企业级开发者持续降低构建成本。
容器安全拾遗 - Rootless Container初探
Docker和Kubernetes已经成为企业IT架构的基础设施,安全容器运行时越来越被关注。近期Docker 19.03中发布了一个重要的特性 “Rootless Container”,在提升容器的安全隔离性和可管理性方面前进了一大步。
Kubernetes and Cloud Native Meetup (广州站)资料下载
毫无疑问,Kubernetes 已经成为容器领域当之无愧的事实标准。除了 Google、Microsoft 等技术巨擘们在容器领域里多年的博弈外,国内的 BAT、滴滴、蚂蚁、今日头条等技术大厂,也都已将容器和 Kubernetes 列入未来的战略重心,无数中小型企业也正走在容器化的道路上。
通过阿里云容器服务上手Caffe + GPU训练
阿里云容器服务提供的深度学习解决方案内置了对Tensorflow, Keras, MXnet框架的环境,并支持基于它们的深度学习模型开发、模型训练和模型预测。同时,对于模型训练和预测,用户还可以通过指定自定义容器镜像的方式,使用其他深度学习框架。
阿里云 PB 级 Kubernetes 日志平台建设实践
阿里云日志服务技术专家元乙即将在 QCon 北京 2019 分享Kubernetes 日志平台建设最佳实践。 本来来自InfoQ对元乙的采访。
阿里云容器服务kubernetes发布竞价实例支持
竞价实例优化运营成本 竞价实例(Spot Instance)也叫抢占式实例是一种按需实例,旨在降低部分场景下使用ECS的成本,创建竞价实例时,必须为指定的实例规格设置一个价格上限,当指定的实例规格的当前市场价格低于出价时,就能成功创建竞价实例,并按当前市场价格计费。
Kubernetes多租户集群实践
如何解决多租户集群的安全隔离问题是企业上云的一个关键问题,本文主要介绍kubernetes多租户集群的基本概念和常见应用形态,以及在企业内部共享集群的业务场景下,基于kubernetes原生和ACK集群现有安全管理能力快速实现多租户集群的相关方案。
Kubernetes 调度器实现初探
### Kubernetes 调度器 Kubernetes 是一个基于容器的分布式调度器,实现了自己的调度模块。在Kubernetes集群中,调度器作为一个独立模块通过pod运行。从几个方面介绍Kubernetes调度器。
使用OpenStack管理Docker容器(二)
本文讲的是使用OpenStack管理Docker容器(二),【编者的话】本文将讲述如何使用OpenStack创建并管理Docker,有3种流行的使用方法,使用的分别是Nova Docker驱动,Heat Docker插件,以及Magnum。
阿里云容器服务团队实践——Alluxio优化数倍提升云上Kubernetes深度学习训练性能
近些年,以深度学习为代表的人工智能技术取得了飞速的发展,正落地应用于各行各业。越来越多的用户在云上构建人工智能训练平台,利用云平台的弹性计算能力满足高速增长的AI业务模型训练方面的需求,然而这种“本地存储+云上训练”的训练模式加剧了计算存储分离架构带来的远程数据访问的性能影响。
Docker企业版常见问题解答
Docker Enterprise Edition (EE),即Docker企业版,旨在帮助企业开发人员和IT团队在规模化生产环境中构建、交付和运行关键业务应用。本文将介绍企业版常见的一些问题以及如何解决。
通过kubeadm安装kubernetes 1.7文档记录[docker容器方式]
参照了网上N多文档,不一一列表,共享精神永存!!!! ================================================== 获取所有安装包 安装包分为两类,rpm安装包和docker镜像 rpm安装包 rpm为以下四个 kubeadm-1.
使用Logtail采集Kubernetes上挂载的NAS日志
采集k8s挂载Nas后的日志 该文档主要介绍使用logtail以两种不同的方式进行k8s挂载Nas后的日志采集。两种采集方式的实现原理是一样的,都是通过将Logtail和业务容器挂载到相同的NAS上,使Logtail和业务容器的日志数据共享,以此实现日志采集。
容器时代的DevOps部署
本文讲的是容器时代的DevOps部署,企业应用,指的是那些部署在企业的服务器上,为企业的生产与运作提供支撑的核心系统。随着IT技术的发展,企业应用的部署环境不断地发生着变化。
Kubernetes Client-go Informer 源码分析
几乎所有的Controller manager 和CRD Controller 都会使用Client-go 的Informer 函数,这样通过Watch 或者Get List 可以获取对应的Object,下面我们从源码分析角度来看一下Client go Informer 的机制。