官方博客-第7页-阿里云开发者社区

元丹

2024-05-15

283092

深入浅出LangChain与智能Agent：构建下一代AI助手

LangChain为大型语言模型提供了一种全新的搭建和集成方式，通过这个强大的框架，我们可以将复杂的技术任务简化，让创意和创新更加易于实现。本文从LangChain是什么到LangChain的实际案例到智能体的快速发展做了全面的讲解。

元丹

283,092

米基

2024-05-15

4088

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,088

ModelScope

2024-05-15

15468

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

Meta发布了 Meta Llama 3系列，是LLama系列开源大型语言模型的下一代。在接下来的几个月，Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能，并会分享 Llama 3 研究论文。

ModelScope

15,468

新念

2025-02-14

1613

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,613

望宸

2025-02-28

1336

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,336

ModelScope

2024-05-15

3814

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

3,814

ModelScope

2024-05-15

1429

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,429

夏冬

2025-04-01

3661

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

通过遵循以上最佳实践，可以构建一个高效、可靠的 RAG 系统，为用户提供准确和专业的回答。这些实践涵盖了从文档处理到系统配置的各个方面，能够帮助开发者构建更好的 RAG 应用。

夏冬

3,661

雅纯

2024-05-15

103912

一文搞懂需求流程规范的制定方法和落地技巧

随着业务和产品的发展、团队的不断扩大，很多团队都不可避免的会遇到需求流程混乱的问题。虽然有的团队也编写了一些“需求流程规范”的文档，但最终却流于纸面，难以在团队真正落地。如何科学制定并有效落实需求管理规范呢？对此，云效产品经理陈逊进行了非常详细的直播分享，本文是他经验的文字总结。

雅纯

103,912

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

深入浅出LangChain与智能Agent：构建下一代AI助手

大模型推理优化实践：KV cache复用与投机采样

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

DeepSeek-V3 高效训练关键技术分析

大模型推理主战场：通信协议的标配

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

元象大模型开源30款量化版本加速低成本部署丨附教程

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

一文搞懂需求流程规范的制定方法和落地技巧

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

深入浅出LangChain与智能Agent：构建下一代AI助手

大模型推理优化实践：KV cache复用与投机采样

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

DeepSeek-V3 高效训练关键技术分析

大模型推理主战场：通信协议的标配

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

元象大模型开源30款量化版本 加速低成本部署丨附教程

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

一文搞懂需求流程规范的制定方法和落地技巧

元象大模型开源30款量化版本加速低成本部署丨附教程