更加灵活、经济、高效的训练——新一代搜推广稀疏大模型训练范式GBA
近日,阿里巴巴在国际顶级机器学习会议NeurIPS 2022上发表了新的自研训练模式 Gloabl Batch gradients Aggregation (GBA,论文链接:https://arxiv.org/abs/2205.11048),由阿里妈妈事业部搜索广告团队和智能引擎事业部XDL训练引擎团队联合探索和研发。GBA的提出对阿里巴巴搜推广稀疏模型的训练范式带来了架构性的跨越式升级。本文将从GBA的设计思路、收敛性分析及工程实现等方面展开介绍,欢迎阅读交流。
唯一云厂商 I 阿里云高分通过可信云“一云多芯”全部标准测试
在第十届可信云大会上,国内首个《一云多芯技术能力标准体系》由中国信息通信研究院和中国通信标准化协会联合发布。该标准体系涵盖了五大类标准,包括:IaaS平台能力要求、PaaS平台能力要求、PaaS性能要求、云管平台能力要求、稳定性度量评估。在严格的测试标准下,阿里云飞天企业版高分通过全部五项测试,并均获得最高级认证,是首批通过全部标准企业中唯一的云计算厂商。
阿里云 SelectDB 实现日志高效存储与实时分析
阿里云 SelectDB 是由阿里云与飞轮科技合作,基于 Apache Doris 研发的新一代云原生实时数据仓库,聚焦于满足企业级大数据分析需求,广泛应用于实时报表分析、即席多维分析、日志检索分析、湖仓一体分析等场景,致力于为客户提供极致性能、简单易用的数据分析服务。 本方案基于阿里云 SelectDB 构建高性能、低成本、开放的日志存储与分析解决方案,覆盖运维监控、安全审计、业务分析等场景,并通过倒排索引与分级存储实现数据亚秒级检索。在同样的资源下,本方案写入性能达 Elasticsearch 的 5 倍,存储空间占用仅需 Elasticsearch 的 1/4,性价比总体提升 5 倍。
阿里巴巴云原生混部系统 Koordinator 正式开源
脱胎于阿里巴巴内部,经过多年双 11 打磨,每年为公司节省数十亿的混部系统 Koordinator 今天宣布正式开源。通过开源,我们希望将更好的混部能力、调度能力开放到整个行业,帮助企业客户改进云原生工作负载运行的效率、稳定性和计算成本。
阿里巴巴集团全面上云实践与思考
阿里巴巴核心系统在全面上云过程中面临了哪些挑战,又是通过什么样的技术演进和阿里云产品一起解决这些挑战。在阿里CIO学院云原生系列在线课程直播中阿里巴巴集团上云核心决策组成员张瓅玶将为大家讲解阿里巴巴如何看待核心系统全面上云的架构演进?从资源管理模式、高性能基础设施、大规模系统的容量需求、云原生架构转型和无服务器化基础设施演进等领域进行详细解决,并提出以云原生上云为未来演进方向的判断。
资源画像,让容器资源规格的填写不再纠结
阿里云容器服务 ACK 为 Kubernetes 原生的工作负载提供了资源画像的能力,实现容器粒度的资源规格推荐,可以有效简化应用管理员为 Pod 配置 Request 和 Limit 的复杂度。