官方博客-第13页-阿里云开发者社区

ModelScope

2024-05-15

1351

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,351

龙蜥社区OpenAnolis

2024-11-06

917

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

917

阿里云云原生

2025-08-26

645

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

阿里云云速搭 CADT（Cloud Architect Design Tools）推出智能化升级——云小搭，一款基于大模型的 AI 云架构助手，致力于让每一位用户都能“动动嘴”就完成专业级云架构设计。

阿里云云原生

645

阿里云云原生

2024-07-30

3824

5 大场景上手通义灵码企业知识库问答

通义灵码在企业版里还引入了一个超酷的新技能：RAG（Retrieval-Augmented Generation）检索增强生成的能力，本文就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

3,824

阿里云云原生

2024-10-18

1075

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

1,075

阿里云开发者

2024-11-29

1356

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阅读这个文章可能的收获：理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

阿里云开发者

1,356

以珩

2025-04-10

665

用自定义插件生成一篇图文并茂的文章

本文是《5步教你创建大模型自定义插件》的下篇，主要就已有的自定义插件中的生图能力为例，演示如何生成一个图文并茂的文章。

以珩

665

喻奎

2023-06-25

10696

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

喻奎

10,696

赵世振

2024-12-25

2246

通义视觉推理大模型QVQ-72B-preview重磅上线

Qwen团队推出了新成员QVQ-72B-preview，这是一个专注于提升视觉推理能力的实验性研究模型。提升了视觉表示的效率和准确性。它在多模态评测集如MMMU、MathVista和MathVision上表现出色，尤其在数学推理任务中取得了显著进步。尽管如此，该模型仍存在一些局限性，仍在学习和完善中。

赵世振

2,246

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

5 大场景上手通义灵码企业知识库问答

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

用自定义插件生成一篇图文并茂的文章

MaxCompute湖仓一体近实时增量处理技术架构揭秘

通义视觉推理大模型QVQ-72B-preview重磅上线

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

5 大场景上手通义灵码企业知识库问答

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

用自定义插件生成一篇图文并茂的文章

MaxCompute湖仓一体近实时增量处理技术架构揭秘

通义视觉推理大模型QVQ-72B-preview重磅上线