官方博客-第17页-阿里云开发者社区

ModelScope

2024-05-15

644

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

644

ModelScope

2024-05-15

2060

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

2,060

阿里云百炼

2024-07-09

1677

阿里云百炼应用实践系列-基于LlamaIndex的文档问答助手

本文以阿里云百炼官方文档问答助手为例，介绍如何基于阿里云百炼平台打造基于LlamaIndex的RAG文档问答产品。我们基于阿里云百炼平台的底座能力，以官方帮助文档为指定知识库，搭建了问答服务，支持钉钉、Web访问。介绍了相关技术方案和主要代码，供开发者参考。

阿里云百炼

1,677

阿里云云原生

2024-09-14

573

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

本⽂对敏感信息拦截插件的使用方式和实现原理进行了简单介绍，它能够自动检测并处理请求和响应中的敏感词，有效防止敏感信息泄露。通过对不同数据范围的支持和灵活的配置选项，该插件能够适应各种应用场景，确保数据的安全性和合规性。

阿里云云原生

573

雨鸦

2024-12-27

1760

极简开发，极速上线：构建端到端大模型应用

本文将以一个经典的 RAG（检索增强生成）知识问答系统为例，详细介绍从智能体设计到最终应用部署的全流程。

雨鸦

1,760

致问

2023-09-15

120119

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

120,119

ModelScope

2024-05-15

1221

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,221

明巍临城水德

2024-11-14

619

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

619

柯灵

2025-03-11

1670

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力，核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理（OOS）一键部署OpenWebUI+Ollama方案，轻松将QwQ-32B模型部署到ECS，或连接阿里云百炼的在线模型。整个过程无需编写代码，全部在控制台完成，适合新手操作。

柯灵

1,670

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

阿里云百炼应用实践系列-基于LlamaIndex的文档问答助手

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

极简开发，极速上线：构建端到端大模型应用

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

阿里云百炼应用实践系列-基于LlamaIndex的文档问答助手

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

极简开发，极速上线：构建端到端大模型应用

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理