官方博客-第6页-阿里云开发者社区

恭常

2024-09-04

2673

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,673

荣阳

2025-02-28

1415

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,415

元丹

2024-05-15

283082

深入浅出LangChain与智能Agent：构建下一代AI助手

LangChain为大型语言模型提供了一种全新的搭建和集成方式，通过这个强大的框架，我们可以将复杂的技术任务简化，让创意和创新更加易于实现。本文从LangChain是什么到LangChain的实际案例到智能体的快速发展做了全面的讲解。

元丹

283,082

耘越

2024-10-29

1669

AI 辅助编程的效果衡量

本文主要介绍了如何度量研发效能，以及 AI 辅助编程是如何影响效能的，进而阐述如何衡量 AI 辅助编程带来的收益。

耘越

1,669

沈询

2024-11-06

2378

基于开源框架Spring AI Alibaba快速构建Java应用

本文旨在帮助开发者快速掌握并应用 Spring AI Alibaba，提升基于 Java 的大模型应用开发效率和安全性。

沈询

2,378

米基

2024-05-15

4085

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,085

望雲十雨言澈

2025-04-10

789

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

789

夏冬

2025-04-01

3654

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

通过遵循以上最佳实践，可以构建一个高效、可靠的 RAG 系统，为用户提供准确和专业的回答。这些实践涵盖了从文档处理到系统配置的各个方面，能够帮助开发者构建更好的 RAG 应用。

夏冬

3,654

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43913

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,913

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

使用A10单卡24G复现DeepSeek R1强化学习过程

深入浅出LangChain与智能Agent：构建下一代AI助手

AI 辅助编程的效果衡量

基于开源框架Spring AI Alibaba快速构建Java应用

大模型推理优化实践：KV cache复用与投机采样

AI Infra之模型显存管理分析

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

使用A10单卡24G复现DeepSeek R1强化学习过程

深入浅出LangChain与智能Agent：构建下一代AI助手

AI 辅助编程的效果衡量

基于开源框架Spring AI Alibaba快速构建Java应用

大模型推理优化实践：KV cache复用与投机采样

AI Infra之模型显存管理分析

RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统