官方博客-第6页-阿里云开发者社区

阿里云云原生

2024-11-01

1070

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

1,070

阿里云实时数仓Hologres

2022-12-06

1692

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效。

阿里云实时数仓Hologres

1,692

阿里云实时数仓Hologres

2024-05-15

75141

大数据分析平台之 OLAP 架构的最佳实践

本文将分享聚水潭云原生 OLAP 架构的最佳实践。

阿里云实时数仓Hologres

75,141

封崇

2025-04-16

1513

MCP 正当时：FunctionAI MCP 开发平台来了！

MCP 的价值是统一了 Agent 和 LLM 之间的标准化接口，有了 MCP Server 的托管以及开发态能力只是第一步，接下来重要的是做好 MCP 和 Agent 的集成，FunctionAI 即将上线 Agent 开发能力，敬请期待。

封崇

1,513

寒斜

2022-10-14

513

人人都是Serverless架构师之传统内容管理系统改造实战二[踩坑实践]

容管理系统是很常见的一种web应用场景，可以用到个人独立站，企业官网展示等场景，具有很高的实用价值，一个标准的内容管理系统主要由三个部分组成主站展示部分、后台管理系统、API接口服务，本篇文章会以一个已有内容管理系统的Serverless架构重构展开，介绍改造的基本思路，改造细节，以及性能优化业务可观测设计等。涉及大家关心的Serverless生产遇到的一些问题，比如数据库、日志、动静态分离、调试、维护、灰度方案等。最真实的展现Serverless架构的实施落地细节。

寒斜

513

阿里云实时数仓Hologres

2023-07-17

20917

基于Hologres向量计算与大模型免费定制专属聊天机器人

本文为您介绍如何基于Hologres向量计算能力，结合大模型的阅读理解和信息整合能力，对该垂直行业的问题提供更贴切的回答，即费、快速定制专属聊天机器人。

阿里云实时数仓Hologres

20,917

秦涛

2023-07-28

1466

MaxCompute ODPS重装上阵， IF ELSE分支语句

MaxCompute通过脚本模式支持IF ELSE分支语句，让程序根据条件自动选择执行逻辑，支持更好的处理因数据不同而需要采用不同策略的业务场景产生的复杂SQL，提高开发者编程的灵活性！

秦涛

1,466

王骜

2024-05-15

165285

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

165,285

付宇轩

2024-09-14

822

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

阿里云函数计算与 NVIDIA TensorRT/TensorRT-LLM 展开合作，通过结合阿里云的无缝计算体验和 NVIDIA 的高性能推理库，开发者能够以更低的成本、更高的效率完成复杂的 AI 任务，加速技术落地和应用创新。

付宇轩

822

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效

大数据分析平台之 OLAP 架构的最佳实践

MCP 正当时：FunctionAI MCP 开发平台来了！

人人都是Serverless架构师之传统内容管理系统改造实战二[踩坑实践]

基于Hologres向量计算与大模型免费定制专属聊天机器人

MaxCompute ODPS重装上阵， IF ELSE分支语句

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效

大数据分析平台之 OLAP 架构的最佳实践

MCP 正当时：FunctionAI MCP 开发平台来了！

人人都是Serverless架构师之传统内容管理系统改造实战二[踩坑实践]

基于Hologres向量计算与大模型免费定制专属聊天机器人

MaxCompute ODPS重装上阵， IF ELSE分支语句

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地