官方博客-第10页-阿里云开发者社区

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

2024-12-25

741

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

聚焦近日OpenAI的大规模K8s集群故障，介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案：包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。

刘佳旭冯诗淳竺夏栋麻嘉豪隋吉智等

741

尹斌斌周絮

2025-03-21

824

解决隐式内存占用难题

本文详细介绍了在云原生和容器化部署环境中，内存管理和性能优化所面临的挑战及相应的解决方案。

尹斌斌周絮

824

笃敏

2025-03-28

300

架构革新：揭示卓越性能与高可扩展的共赢秘诀

为了构建现代化的可观测数据采集器LoongCollector，iLogtail启动架构通用化升级，旨在提供高可靠、高可扩展和高性能的实时数据采集和计算服务。然而，通用化的过程总会伴随性能劣化，本文重点介绍LoongCollector的性能优化之路，并对通用化和高性能之间的平衡给出见解。

笃敏

300

执少

2025-04-02

584

SLS 重磅升级：超大规模数据实现完全精确分析

SLS 全新推出的「SQL 完全精确」模式，通过“限”与“换”的策略切换，在快速分析与精确计算之间实现平衡，满足用户对于超大数据规模分析结果精确的刚性需求。标志着其在超大规模日志数据分析领域再次迈出了重要的一步。

执少

584

豁朗

2021-08-13

2491

用SLS配置日志关键字告警的N种方法

本文主要介绍一种免运维，高性能，支持灵活配置的方案，使用SLS接入日志和告警。

豁朗

2,491

豁朗

2022-05-16

2347

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

本文提供一种相对Sidecar部署更轻量级的采集方式，只需要部署少量的Logtail容器，即可采集不同业务容器的日志。

豁朗

2,347

阿里云实时计算Flink

2023-04-13

1322

海量数据实时分析引擎 Apache Flink

当系统出现大量或者重大的错误却不被人感知，将会对业务产生影响，从而导致资产损失。当竞争对手实施了新战术，却无法及时感知，跟不上竞争对手的节奏，总是追着对方尾巴走。当要做决策的时候，海量的业务数据增长却无法实时看到聚合结果，决策总是凭借过往经验或者过时的数据分析之上。

阿里云实时计算Flink

1,322

阿里云实时数仓Hologres

2023-07-17

20918

基于Hologres向量计算与大模型免费定制专属聊天机器人

本文为您介绍如何基于Hologres向量计算能力，结合大模型的阅读理解和信息整合能力，对该垂直行业的问题提供更贴切的回答，即费、快速定制专属聊天机器人。

阿里云实时数仓Hologres

20,918

阿里云云原生

2023-07-27

43935

一文详解Spring Bean循环依赖

本文主要梳理了Spring解决bean循环依赖的思路。

阿里云云原生

43,935

官方博客-第10页-阿里云开发者社区

类目筛选

内容类型

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

解决隐式内存占用难题

架构革新：揭示卓越性能与高可扩展的共赢秘诀

SLS 重磅升级：超大规模数据实现完全精确分析

用SLS配置日志关键字告警的N种方法

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

海量数据实时分析引擎 Apache Flink

基于Hologres向量计算与大模型免费定制专属聊天机器人

一文详解Spring Bean循环依赖

官方博客-第10页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性

解决隐式内存占用难题

架构革新：揭示卓越性能与高可扩展的共赢秘诀

SLS 重磅升级：超大规模数据实现完全精确分析

用SLS配置日志关键字告警的N种方法

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

海量数据实时分析引擎 Apache Flink

基于Hologres向量计算与大模型免费定制专属聊天机器人

一文详解Spring Bean循环依赖