官方博客-第5页-阿里云开发者社区

探索云世界

2025-11-17

497

阿里云 AI 搜索 DeepSearch 技术实践

阿里云OpenSearch LLM版推出DeepSearch技术，实现从RAG 1.0到RAG 2.0的升级。基于多智能体协同架构，支持复杂推理、多源检索与深度搜索，显著提升问答准确率，助力企业智能化升级。

探索云世界

497

米基

2024-05-15

4105

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,105

赵世振

2025-01-09

2474

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

本文章旨在帮助读者了解并掌握大模型多模态技术的实际应用，特别是如何构建基于多模态的实用场景。文档通过几个具体的多模态应用场景，如拍立淘、探一下和诗歌相机，展示了这些技术在日常生活中的应用潜力。

赵世振

2,474

学仁

2025-05-29

2457

Dify是一款开源的大模型应用开发平台，支持通过可视化界面快速构建AI Agent和工作流。然而，Dify本身缺乏定时调度与监控报警功能，且执行记录过多可能影响性能。为解决这些问题，可采用Dify Schedule或XXL-JOB集成Dify工作流。Dify Schedule基于GitHub Actions实现定时调度，但仅支持公网部署、调度延时较大且配置复杂。相比之下，XXL-JOB提供秒级调度、内网安全防护、限流控制及企业级报警等优势，更适合大规模、高精度的调度需求。两者对比显示，XXL-JOB在功能性和易用性上更具竞争力。

学仁

2,457

希秀吴诗倩柳佚洲公等

2024-09-03

3831

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

本文详细阐述了Prompt的设计要素，包括引导语、上下文信息等，还介绍了多种Prompt编写策略，如复杂规则拆分、关键信息冗余、使用分隔符等，旨在提高模型输出的质量和准确性。通过不断尝试、调整和优化，可逐步实现更优的Prompt设计。

希秀吴诗倩柳佚洲公等

3,831

望雲十雨言澈

2025-04-10

810

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

810

子潍

2025-05-22

1755

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

本文介绍了通过MCP（Model Context Protocol）结合通义千问大模型实现跨平台、跨服务的自动化任务处理方案。使用Qwen3-235B-A22B模型，配合ComfyUI生成图像，并通过小红书等社交媒体发布内容，展示了如何打破AI云服务的数据孤岛。具体实践包括接入FileSystem、ComfyUI和第三方媒体Server，完成从本地文件读取到生成图像再到发布的全流程。方案优势在于高可扩展性和易用性，但也存在大模型智能化不足、MCP Server开发难度较大及安全风险等问题。未来需进一步提升模型能力、丰富应用场景并解决安全挑战，推动MCP在更多领域落地。

子潍

1,755

德灵

2024-05-15

118273

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,273

唐殊

2024-11-01

2347

探索LLM推理全阶段的JSON格式输出限制方法

文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

唐殊

2,347

官方博客-第5页-阿里云开发者社区

类目筛选

内容类型

阿里云 AI 搜索 DeepSearch 技术实践

大模型推理优化实践：KV cache复用与投机采样

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

管理和调度Dify工作流

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

AI Infra之模型显存管理分析

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

阿里云PAI大模型RAG对话系统最佳实践

探索LLM推理全阶段的JSON格式输出限制方法

官方博客-第5页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

阿里云 AI 搜索 DeepSearch 技术实践

大模型推理优化实践：KV cache复用与投机采样

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

管理和调度Dify工作流

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

AI Infra之模型显存管理分析

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

阿里云PAI大模型RAG对话系统最佳实践

探索LLM推理全阶段的JSON格式输出限制方法