大模型服务平台百炼的搜索结果_热门_第7页-阿里云开发者社区

聚客AI

|

3月前

|

博文

|

在LLM推理中，Prefill（计算密集）与Decode（访存密集）阶段特性不同，分离计算可提升资源利用率。本文详解vLLM框架中的PD分离实现及局限，并分析Dynamo、Mooncake、SGLang等主流方案，探讨KV缓存、传输机制与调度策略，助力LLM推理优化。建议点赞收藏，便于后续查阅。

# 大模型服务平台百炼 # 存储 # 缓存 # 负载均衡 # 调度 # 内存技术

aliyunid_2045078797d_rjz-47650

|

博文

|

来自：通义大模型

通义千问API：用4行代码对话大模型

本章将通过一个简单的例子，让你快速进入到通义千问大模型应用开发的世界。

# 云原生大数据计算服务 MaxCompute # 大模型服务平台百炼 # 自然语言处理 # 搜索推荐 # API # 流计算 # Linux

是安可啊

|

博文

|

来自：通义大模型

通义灵码真好用！

通义灵码小白体验手把手教程，真的很好用呢!

# 大模型服务平台百炼 # 自然语言处理 # IDE # Java # 测试技术 # 开发工具

游客3wlkklvxbishq

|

6天前

|

博文

|

来自：阿里云百炼

SpringAI+DeepSeek大模型应用开发

SpringAI整合主流大模型，支持对话、函数调用与RAG，提供统一API，简化开发。涵盖多模态、流式传输、会话记忆等功能，助力快速构建AI应用。

# 大模型服务平台百炼 # 人工智能 # 自然语言处理 # 前端开发 # Java # 数据库

coder一枚

|

3月前

|

博文

|

来自：阿里云百炼

阿里云百炼大模型收费说明：模型推理、模型训练和模型部署费用整理

阿里云百炼平台开通免费，且每模型享100万Token免费额度。费用产生于模型推理、训练（调优）和部署，超出免费额度后按量计费。推理按输入/输出Token阶梯计价，训练按数据量和循环次数计费，部署支持按时长或调用量两种模式。

# 大模型服务平台百炼 # 人工智能 # 缓存 # 自然语言处理 # 语音技术

bailiantest1

|

博文

|

来自：阿里云百炼

全新开源通义千问Qwen3上架阿里云百炼

Qwen3是Qwen系列大型语言模型的最新成员，作为混合推理模型，其旗舰版本Qwen3-235B-A22B在代码、数学和通用能力测试中表现出色，与顶级模型DeepSeek-R1、o1、o3-mini等相比具有竞争力。小型MoE模型Qwen3-30B-A3B激活参数仅为QwQ-32B的10%，性能更优，甚至小规模模型Qwen3-4B也能匹敌Qwen2.5-72B-Instruct。Qwen3支持思考与非思考两种模式，可根据任务需求灵活调整推理深度，并支持119种语言，Qwen3在推理、工具调用及多语言处理等方面显著提升，目前已开源并在阿里云百炼平台上线，提供便捷体验。

# 大模型服务平台百炼 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 测试技术 # API

bailiantest1

|

8天前

|

博文

|

来自：阿里云百炼

阿里云析言XiYan-SQL智能体，登顶BIRD-CRITIC全球榜单！

阿里云飞天实验室自研数据分析智能体“析言 XiYan-SQL”在全球权威SQL诊断基准BIRD-CRITIC（SWE-SQL）多项榜单中排名第一，超越国内外顶尖团队。该模型在真实数据库问题诊断、跨方言鲁棒性、复杂SQL处理及分布外泛化等方面表现卓越，支持MySQL、PostgreSQL等主流数据库。技术上创新采用模式筛选、多生成器集成与候选重组策略，提升SQL生成质量与系统适应性。核心模型已开源至GitHub、ModelScope和Hugging Face，欢迎开发者体验贡献。

# 大模型服务平台百炼 # SQL # 关系型数据库 # 数据挖掘 # MySQL # 数据库

AI未闻花名

|

4天前

|

博文

|

来自：通义大模型

构建AI智能体：六十一、信息论完全指南：从基础概念到在大模型中的实际应用

摘要：信息论是人工智能尤其是大语言模型的核心数学工具。本文系统介绍了八大核心概念：信息量：衡量事件意外程度，公式为I(x)=-log₂P(x) 信息熵：评估系统不确定性，H(X)=-ΣP(x)log₂P(x) 联合熵/条件熵：分析多变量关系及条件不确定性互信息：量化变量间共享信息量 KL散度：衡量概率分布差异交叉熵：模型训练的核心损失函数在大语言模型中，这些概念被广泛应用于：训练阶段：交叉熵优化预测，KL散度防止过拟合推理阶段：温度参数调节生成文本的创造性（高熵增加多样性）

# 大模型服务平台百炼 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 算法 # Python

AI未闻花名

|

2月前

|

博文

|

来自：阿里云百炼

构建AI智能体：一、初识AI大模型与API调用

本文介绍大模型基础知识及API调用方法，涵盖阿里云百炼平台密钥申请、DashScope SDK使用、Python调用示例（如文本情感分析、图像文字识别），助力开发者快速上手大模型应用开发。

# 大模型服务平台百炼 # 人工智能 # API # 开发工具 # 开发者 # Python

喜欢猪猪

|

5月前

|

博文

|

来自：通义大模型

# Qwen3-8B 的 TTFT 性能分析：16K 与 32K 输入 Prompt 的推算公式与底层原理详解

Qwen3-8B 是通义实验室推出的 80 亿参数大模型，支持最长 32,768 token 上下文，适用于长文本处理场景。通过 FP8 量化、CUDA Kernel 优化及 RoPE 位置编码技术，提升推理效率与稳定性。模型在 16K 输入下 TTFT 约 150-200ms，32K 输入下约 250-300ms，适用于文档摘要与长对话交互。

# 大模型服务平台百炼 # 存储 # 缓存 # 资源调度 # 并行计算 # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

大模型服务平台百炼