大模型
产品
解决方案
权益
定价
云市场
伙伴
服务
了解阿里云
查看 “
” 全部搜索结果
AI 助理
文档
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
热门
百炼大模型
Modelscope模型即服务
弹性计算
通义灵码
云原生
数据库
云效DevOps
龙蜥操作系统
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
镜像站
开发者社区
ModelScope模型即服务
文章
正文
GDC2025 | 探索最前沿的开源大模型技术与创新,2025全球开发者先锋大会,上海见!
2025-02-19
431
版权
版权声明:
本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《
阿里云开发者社区用户服务协议
》和 《
阿里云开发者社区知识产权保护指引
》。如果您发现本社区中有涉嫌抄袭的内容,填写
侵权投诉表单
进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
简介:
2025全球开发者先锋大会将于2月21-23日在徐汇盛大召开!大会以“模塑全球 无限可能”为主题,定位“社区的社区”,旨在促进基模、垂模、语料、算力、基金、开发者、软件服务等产业生态深度对接。
文章标签:
开发者
自然语言处理
modelscope
目录
相关文章
JJLIN距离
|
6月前
|
负载均衡
测试技术
调度
大模型分布式推理:张量并行与流水线并行技术
本文深入探讨大语言模型分布式推理的核心技术——张量并行与流水线并行。通过分析单GPU内存限制下的模型部署挑战,详细解析张量并行的矩阵分片策略、流水线并行的阶段划分机制,以及二者的混合并行架构。文章包含完整的分布式推理框架实现、通信优化策略和性能调优指南,为千亿参数大模型的分布式部署提供全面解决方案。
JJLIN距离
1630
4
4
JJLIN距离
|
6月前
|
存储
机器学习/深度学习
人工智能
大模型微调技术:LoRA原理与实践
本文深入解析大语言模型微调中的关键技术——低秩自适应(LoRA)。通过分析全参数微调的计算瓶颈,详细阐述LoRA的数学原理、实现机制和优势特点。文章包含完整的PyTorch实现代码、性能对比实验以及实际应用场景,为开发者提供高效微调大模型的实践指南。
JJLIN距离
2886
3
8
JJLIN距离
|
6月前
|
机器学习/深度学习
缓存
监控
大模型推理优化技术:KV缓存机制详解
本文深入探讨了大语言模型推理过程中的关键技术——KV缓存(Key-Value Cache)机制。通过对Transformer自注意力机制的分析,阐述了KV缓存的工作原理、实现方式及其对推理性能的显著优化效果。文章包含具体的代码实现和性能对比数据,为开发者理解和应用这一关键技术提供实践指导。
JJLIN距离
1916
8
8
代码bug生产队
|
6月前
|
人工智能
机器人
人机交互
当AI学会“看、听、懂”:多模态技术的现在与未来
当AI学会“看、听、懂”:多模态技术的现在与未来
代码bug生产队
424
117
117
计算机程序设计的泡泡Y2013070224
|
7月前
|
监控
JavaScript
Java
基于大模型技术的反欺诈知识问答系统
随着互联网与金融科技发展,网络欺诈频发,构建高效反欺诈平台成为迫切需求。本文基于Java、Vue.js、Spring Boot与MySQL技术,设计实现集欺诈识别、宣传教育、用户互动于一体的反欺诈系统,提升公众防范意识,助力企业合规与用户权益保护。
计算机程序设计的泡泡Y2013070224
397
127
127
basu2023
|
6月前
|
人工智能
自然语言处理
安全
AI助教系统:基于大模型与智能体架构的新一代教育技术引擎
AI助教系统融合大语言模型、教育知识图谱、多模态交互与智能体架构,实现精准学情诊断、个性化辅导与主动教学。支持图文语音输入,本地化部署保障隐私,重构“教、学、评、辅”全链路,推动因材施教落地,助力教育数字化转型。(238字)
basu2023
1075
23
25
JJLIN距离
|
6月前
|
机器学习/深度学习
存储
并行计算
大模型推理加速技术:FlashAttention原理与实现
本文深入解析大语言模型推理加速的核心技术——FlashAttention。通过分析传统注意力机制的计算瓶颈,详细阐述FlashAttention的IO感知算法设计、前向反向传播实现,以及其在GPU内存层次结构中的优化策略。文章包含完整的CUDA实现示例、性能基准测试和实际部署指南,为开发者提供高效注意力计算的全套解决方案。
JJLIN距离
1165
10
10
bug菌
|
6月前
|
人工智能
文字识别
自然语言处理
从“看见”到“预见”:合合信息“多模态文本智能技术”如何引爆AI下一场革命。
近期,在第八届中国模式识别与计算机视觉学术会议(PRCV 2025)上,合合信息作为承办方举办了“多模态文本智能大模型前沿技术与应用”论坛,汇聚了学术界的顶尖智慧,更抛出了一颗重磅“炸弹”——“多模态文本智能技术”概念。
bug菌
284
1
1
JJLIN距离
|
6月前
|
存储
人工智能
算法
大模型4-bit量化技术详解
本文系统阐述大语言模型的4-bit量化技术,深入解析GPTQ、AWQ等主流量化方法的原理与实现。通过详细的数学推导、代码实现和实验对比,展示4-bit量化如何将模型内存占用降低75%以上同时保持模型性能。文章涵盖量化感知训练、后训练量化、混合精度量化等关键技术,为开发者提供完整的模型压缩解决方案。
JJLIN距离
1499
7
7
JJLIN距离
|
6月前
|
监控
算法
测试技术
大模型推理服务优化:动态批处理与连续批处理技术
本文系统阐述大语言模型推理服务中的关键技术——动态批处理与连续批处理。通过分析传统静态批处理的局限性,深入解析动态批处理的请求调度算法、内存管理策略,以及连续批处理的中断恢复机制。文章包含完整的服务架构设计、核心算法实现和性能基准测试,为构建高性能大模型推理服务提供全面解决方案。
JJLIN距离
788
3
3
ModelScope模型即服务
热门文章
最新文章
1
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
2
Qwen-Image-Edit:全能图像编辑,驱动内容创作提质增效
3
Qwen3.5 中等规模模型系列正式开源:更强智能,更低算力
4
嵌入式开发必备!Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含(Keil MDK 5.39)
5
CoPaw 1.0 发布:定制小模型、安全机制与多智能体全面进化
6
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
7
Claude Code 源码泄露,升级 OpenClaw 的研究方案
8
【Seedance 2.0 技术解析】:字节跳动电影级多模态视频生成模型全景剖析
9
AgentScope:阿里开源多智能体低代码开发平台,支持一键导出源码、多种模型API和本地模型部署
10
GLM-5开源:迈向Agentic Engineering新范式,社区Day0 部署、推理实战来了!
1
Spring AI Alibaba + MCP:调用MCP市场公开服务实操
31
2
避坑指南|为什么你的 OpenClaw 没用?只因少装这 4 个核心技能
42
3
OpenCSG重磅开源|CIMD开源,打造垂类数据集
36
4
Gemma 4 开源发布: Google 迄今最强开放模型,主打推理与 Agent 能力
156
5
OpAgent开源:登顶 WebArena,蚂蚁集团开源全模态网页智能体
50
6
使用Java对接印度股票市场API 实时数据、IPO和K线(Kline)的PHP对接方案
105
7
【Seedance 2.0 技术解析】:字节跳动电影级多模态视频生成模型全景剖析
354
8
OpenClaw: The Open-Source AI Agent That's Changing How We Work and Live
195
9
Claude Code 源码泄露,升级 OpenClaw 的研究方案
415
10
一文吃透 Spring AI Alibaba + MCP:服务端搭建 + 客户端调用全流程
226
相关课程
更多
阿里云大模型工程师ACA认证课程
阿里云百炼大模型产品实践
ADB-PG+大模型一站式AIGC解决方案
阿里云百炼,手把手教你如何构建企业大模型应用服务
云原生AI套件:一键训练大模型及部署GPU共享推理服务
【开眼界】大模型时代的个人应对策略
相关电子书
更多
OpenSearch向量检索和大模型方案
通义万相:视觉生成大模型的进化与应用
达摩院通义视觉生成大模型
下一篇
OSS图形化管理工具使用