官方博客-第8页-阿里云开发者社区

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43927

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,927

砚染

2024-09-03

1854

速成RAG+Agent框架大模型应用搭建

本文侧重于能力总结和实操搭建部分，从大模型应用的多个原子能力实现出发，到最终串联搭建一个RAG+Agent架构的大模型应用。

砚染

1,854

新念

2025-02-14

1619

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,619

ant-ray项目组

2025-04-11

1493

AI开源框架：让分布式系统调试不再"黑盒"

Ray是一个开源分布式计算框架，专为支持可扩展的人工智能（AI）和Python应用程序而设计。它通过提供简单直观的API简化分布式计算，使得开发者能够高效编写并行和分布式应用程序。Ray广泛应用于深度学习训练、大规模推理服务、强化学习以及AI数据处理等场景，并构建了丰富而成熟的技术生态。

ant-ray项目组

1,493

阿里云实时计算Flink

2023-03-30

5279

Apache Paimon 在同程旅行的探索实践

本文主要介绍 Apache Paimon 在同程旅行的生产落地实践经验。

阿里云实时计算Flink

5,279

怀潜

2023-05-10

3221

Hologres+大模型初探，让ChatGPT回答商家问题

本文介绍基于Hologres+ChatGPT提供智能客服服务的实践。

怀潜

3,221

扬流

2024-05-15

119369

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

119,369

望宸

2025-02-20

926

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

926

探索云世界

2025-11-17

218

PAIFuser：面向图像视频的训练推理加速框架

阿里云PAI推出PAIFuser框架，专为视频生成模型设计，通过模型并行、量化优化、稀疏运算等技术，显著提升DiT架构的训练与推理效率。实测显示，推理耗时最高降低82.96%，训练时间减少28.13%，助力高效低成本AI视频生成。

探索云世界

218

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

速成RAG+Agent框架大模型应用搭建

DeepSeek-V3 高效训练关键技术分析

AI开源框架：让分布式系统调试不再"黑盒"

Apache Paimon 在同程旅行的探索实践

Hologres+大模型初探，让ChatGPT回答商家问题

Paimon 与 Spark 的集成（二）：查询优化

大模型推理服务全景图

PAIFuser：面向图像视频的训练推理加速框架

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

速成RAG+Agent框架大模型应用搭建

DeepSeek-V3 高效训练关键技术分析

AI开源框架：让分布式系统调试不再"黑盒"

Apache Paimon 在同程旅行的探索实践

Hologres+大模型初探，让ChatGPT回答商家问题

Paimon 与 Spark 的集成（二）：查询优化

大模型推理服务全景图

PAIFuser：面向图像视频的训练推理加速框架