官方博客-第17页-阿里云开发者社区

王奇

2023-06-26

8822

Hologres弹性计算在OLAP分析上的实践和探索

本文介绍了OLAP分析在大数据分析中的位置，分析并介绍目前大数据OLAP遇到的分析性能、资源隔离、高可用、弹性扩缩容等核心问题，解析阿里云Hologres是如何解决极致性能、弹性、业务永续、性价比等核心刚需的最佳实践，介绍阿里云Hologres弹性计算组在弹性计算、资源隔离上的探索和创新。

王奇

8,822

ModelScope

2024-05-15

110158

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,158

阿里云大数据Al技术

2024-05-15

78295

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

78,295

奶司

2024-05-15

1186

人人都是AI大师 - Prompt工程

prompt工程不需要复杂的编程知识，人人都可以使用prompt工程成为AI大师。本文只探讨prompt工程，不涉及模型训练等内容。只讨论文本生成，不涉及图像等领域。

奶司

1,186

寻剑

2024-09-11

428

表格存储低成本向量检索服务助力 AI 检索

本文阐述了阿里云表格存储（Tablestore）如何通过其向量检索服务应对大规模数据检索的需求，尤其是在成本、规模和召回率这三个关键挑战方面。

寻剑

428

明巍临城水德

2024-11-14

614

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

614

城危

2025-01-23

483

过年啦，做一个春节贺卡生成器

本文介绍了如何获取和利用现有的大模型资源，结合魔笔低代码，低成本、高效率地打造一个 AI 春节贺卡生成器。

城危

483

亦达

2025-02-20

812

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

812

丕天

2025-03-21

1313

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,313

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

Hologres弹性计算在OLAP分析上的实践和探索

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

【AAAI 2024】MuLTI：高效视频与语言理解

人人都是AI大师 - Prompt工程

表格存储低成本向量检索服务助力 AI 检索

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

过年啦，做一个春节贺卡生成器

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI 推理场景的痛点和解决方案

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Hologres弹性计算在OLAP分析上的实践和探索

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

【AAAI 2024】MuLTI：高效视频与语言理解

人人都是AI大师 - Prompt工程

表格存储低成本向量检索服务助力 AI 检索

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

过年啦，做一个春节贺卡生成器

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI 推理场景的痛点和解决方案

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理