官方博客-第6页-阿里云开发者社区

米基

2024-05-15

4097

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,097

唐殊

2024-11-01

2338

探索LLM推理全阶段的JSON格式输出限制方法

文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

唐殊

2,338

望宸

2025-02-28

1344

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,344

杨永

2024-05-15

94037

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

94,037

德灵

2024-05-15

118267

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,267

元丹

2024-05-15

283097

深入浅出LangChain与智能Agent：构建下一代AI助手

LangChain为大型语言模型提供了一种全新的搭建和集成方式，通过这个强大的框架，我们可以将复杂的技术任务简化，让创意和创新更加易于实现。本文从LangChain是什么到LangChain的实际案例到智能体的快速发展做了全面的讲解。

元丹

283,097

沈询

2024-11-06

2393

基于开源框架Spring AI Alibaba快速构建Java应用

本文旨在帮助开发者快速掌握并应用 Spring AI Alibaba，提升基于 Java 的大模型应用开发效率和安全性。

沈询

2,393

赵世振

2024-12-24

1630

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,630

新念

2025-02-14

1618

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,618

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

探索LLM推理全阶段的JSON格式输出限制方法

大模型推理主战场：通信协议的标配

使用KMS为MSE-Nacos敏感配置加密的最佳实践

阿里云PAI大模型RAG对话系统最佳实践

深入浅出LangChain与智能Agent：构建下一代AI助手

基于开源框架Spring AI Alibaba快速构建Java应用

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

DeepSeek-V3 高效训练关键技术分析

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

探索LLM推理全阶段的JSON格式输出限制方法

大模型推理主战场：通信协议的标配

使用KMS为MSE-Nacos敏感配置加密的最佳实践

阿里云PAI大模型RAG对话系统最佳实践

深入浅出LangChain与智能Agent：构建下一代AI助手

基于开源框架Spring AI Alibaba快速构建Java应用

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

DeepSeek-V3 高效训练关键技术分析