官方博客-第9页-阿里云开发者社区

扬流

2024-05-15

119349

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

119,349

米基

2024-05-15

4069

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,069

砚染

2024-09-03

1835

速成RAG+Agent框架大模型应用搭建

本文侧重于能力总结和实操搭建部分，从大模型应用的多个原子能力实现出发，到最终串联搭建一个RAG+Agent架构的大模型应用。

砚染

1,835

阿里云云原生

2025-01-10

606

Qwen2.5 的云端新体验，5 分钟完成极速部署

将 Qwen2.5 模型部署于函数计算 FC，用户能依据业务需求调整资源配置，有效应对高并发场景，并通过优化资源配置，如调整实例规格、多 GPU 部署和模型量化来提升推理速度。此外，函数计算支持多样化 GPU 计费模式（按需计费、阶梯定价、极速模式），可根据业务需求调整，在面对高频请求和大规模数据处理时，能够显著降低综合成本。

阿里云云原生

606

阿里云云原生

2025-02-25

1353

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,353

ModelScope

2024-05-15

1625

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

1,625

阿里云开发者

2025-04-24

1379

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,379

ModelScope

2024-05-15

3795

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

3,795

阿里云云原生

2024-05-15

74041

通义灵码技术解析，打造 AI 原生开发新范式

本文第一部分先介绍 AIGC 对软件研发的根本性影响，从宏观上介绍当下的趋势；第二部分将介绍 Copilot 模式，第三部分是未来软件研发 Agent 产品的进展。

阿里云云原生

74,041

官方博客-第9页-阿里云开发者社区

类目筛选

内容类型

Paimon 与 Spark 的集成（二）：查询优化

大模型推理优化实践：KV cache复用与投机采样

速成RAG+Agent框架大模型应用搭建

Qwen2.5 的云端新体验，5 分钟完成极速部署

解锁 DeepSeek 安全接入、稳定运行新路径

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

为什么一定要做Agent智能体？

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义灵码技术解析，打造 AI 原生开发新范式

官方博客-第9页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Paimon 与 Spark 的集成（二）：查询优化

大模型推理优化实践：KV cache复用与投机采样

速成RAG+Agent框架大模型应用搭建

Qwen2.5 的云端新体验，5 分钟完成极速部署

解锁 DeepSeek 安全接入、稳定运行新路径

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

为什么一定要做Agent智能体？

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义灵码技术解析，打造 AI 原生开发新范式