官方博客-第12页-阿里云开发者社区

裘展

2024-11-07

1796

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,796

右予故黎

2024-11-21

1258

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

1,258

殳玄

2025-01-16

1284

现身说法，AI小白的大模型学习路径

写这篇文章的初衷：作为一个AI小白，把我自己学习大模型的学习路径还原出来，包括理解的逻辑、看到的比较好的学习材料，通过一篇文章给串起来，对大模型建立起一个相对体系化的认知，才能够在扑面而来的大模型时代，看出点门道。

殳玄

1,284

澄潭

2025-04-03

2045

开源 Remote MCP Server 一站式托管来啦！

MCP Server 的实施存在着诸多挑战，特别是在认证授权、服务可靠性和可观测性方面，Higress 作为 AI 原生的 API 网关，提供了完整的开源 MCP Server 托管解决方案，实现存量 API 到 MCP 的协议转换。即将上线的 MCP 市场，将大幅降低开发者构建 MCP Server 的时间和人力成本。

澄潭

2,045

赵世振

2024-12-25

2238

通义视觉推理大模型QVQ-72B-preview重磅上线

Qwen团队推出了新成员QVQ-72B-preview，这是一个专注于提升视觉推理能力的实验性研究模型。提升了视觉表示的效率和准确性。它在多模态评测集如MMMU、MathVista和MathVision上表现出色，尤其在数学推理任务中取得了显著进步。尽管如此，该模型仍存在一些局限性，仍在学习和完善中。

赵世振

2,238

叶枫

2025-02-06

627

详解智能编码在前端研发的创新应用

接下来，人与智能体的交互将变得更为紧密，比如 N 年以后是否可以逐渐过渡。这个逐渐过渡的过程实际上是温和的，从依赖人类到依赖超大规模算力的转变，可能会取代我们的一些职责。这不仅仅是简单的叠加关系。对于AI和超大规模算力，这是否意味着我们可以大幅度提升软件质量，是否可以缩短研发周期并提高效率，还有创造出更优质的软件并持续发展，这无疑是肯定的。

叶枫

627

灵杰开发者

2025-08-08

835

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

835

ModelScope

2024-05-15

2019

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

2,019

ModelScope

2024-05-15

920

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

920

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

白话文讲解大模型｜ Attention is all you need

“无”中生有：基于知识增强的RAG优化实践

现身说法，AI小白的大模型学习路径

开源 Remote MCP Server 一站式托管来啦！

通义视觉推理大模型QVQ-72B-preview重磅上线

详解智能编码在前端研发的创新应用

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

Multi-Agent实践第7期：智能体的高效协作

联合XTuner，魔搭社区全面支持数据集的长文本训练

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

白话文讲解大模型｜ Attention is all you need

“无”中生有：基于知识增强的RAG优化实践

现身说法，AI小白的大模型学习路径

开源 Remote MCP Server 一站式托管来啦！

通义视觉推理大模型QVQ-72B-preview重磅上线

详解智能编码在前端研发的创新应用

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

Multi-Agent实践第7期：智能体的高效协作

联合XTuner，魔搭社区全面支持数据集的长文本训练