|
存储 并行计算 PyTorch
|

社区供稿 | 10G显存,通义千问-7B-int4消费级显卡最佳实践

在魔搭社区,通义千问团队发布了Qwen-7B-Chat的Int4量化模型,Qwen-7B-Chat-Int4。该方案的优势在于,它能够实现几乎无损的性能表现,模型大小仅为5.5GB,内存消耗低,速度甚至超过BF16。

28491 8
|
4月前
|
人工智能 JSON 前端开发
|

告别无效调参!ReAct代理设计:让LLM精准执行复杂任务的终极方案

ReAct模式通过“推理+行动”循环,使大语言模型能自主调用工具、获取实时信息并执行多步骤任务,有效突破LLM固有局限,提升任务准确性和智能化水平。

696 0
|
4月前
|
人工智能 数据可视化 开发者
|

深度解析基于LangGraph的Agent系统架构设计与工程实践

LangGraph作为Agent 生态中非常热门的框架,今天我将借助 LangGraph,更高效、更优雅的方式构建复杂智能体系统。

1232 2
|
8月前
|
机器学习/深度学习 编解码 缓存
|

通义万相2.1首尾帧模型开源!细节真实生动+过渡丝滑,指令遵循表现出色!

通义万相2.1首尾帧模型开源!细节真实生动+过渡丝滑,指令遵循表现出色!

1116 7

昇腾910A部署Qwen2-7B教程

Qwen2-7BS适配昇腾910A教程。

2285 0
|
8月前
|
Arthas 监控 Java
|

Arthas profiler(使用async-profiler对应用采样,生成火焰图)

Arthas profiler(使用async-profiler对应用采样,生成火焰图)

1215 10
|
人工智能 安全 API
|

什么是阿里云百炼?

什么是阿里云百炼?

4103 0
|
自然语言处理 开发者
|

通义语音大模型评测:CosyVoice与SenseVoice

随着人工智能技术的不断发展,语音生成和理解模型在各个领域得到了广泛应用。本文将评测两个由FunAudioLLM团队开发的多语言语音模型——[CosyVoice](https://github.com/FunAudioLLM/CosyVoice)和[SenseVoice](https://github.com/FunAudioLLM/SenseVoice),并结合阿里云开发者社区的相关资源,探讨其在实际应用中的表现。

3023 3
|
机器学习/深度学习 人工智能 达摩院
|

覆盖200+服务场景,阿里「通义」大模型系列打造国内首个AI统一底座(1)

覆盖200+服务场景,阿里「通义」大模型系列打造国内首个AI统一底座

2151 0
|
人工智能 前端开发 API
|

基于agentscope的多智能体游戏场景-骗子酒馆

骗子酒馆是一款基于多智能体系统的在线社交推理游戏,玩家通过掷骰子和扑克牌进行智力和心理博弈,结合大语言模型技术,每个游戏角色由AI扮演,具备独特的性格和决策逻辑,提供高度沉浸式的体验。游戏采用黑板通信模式,确保信息高效交换,支持多种角色如胆小鬼、占卜师等,每个角色拥有特定的技能和行为模式,增强游戏的策略深度和互动性。游戏界面简洁,操作流畅,适合喜欢心理战和策略游戏的玩家。文章末尾有源码和体验地址。

1612 13
|
机器学习/深度学习 人工智能 自然语言处理
|

AI大模型企业应用实战-什么是zero-shot, one-shot和few-shot Learning

【8月更文挑战第17天】

1432 0
|
人工智能 JSON API
|

一张图读懂大模型应用是如何工作的,一图胜千言

用一张图,带你轻松读懂大模型应用的工作原理。不需要复杂的代码和艰深的理论,只需要一张图,就能让你对大模型有一个全新的认识

2544 2
|
19天前
|
人工智能 JavaScript IDE
|

别用"战术勤奋"掩盖"战略懒惰":AI时代的降维竞品分析

5%的产品死于"盲视"。本文不仅是一套竞品分析AI指令,更是一次从战术勤奋到战略觉醒的认知升级。教你如何利用AI构建全天候商业情报雷达,寻找巨头缝隙中的差异化生存之道,实现商业战场的降维打击。

172 7
|
1月前
|
人工智能 弹性计算 自然语言处理
|

史上首次!万卡AI集群支撑双11,通义千问大规模落地

2025年双11,阿里云提供超千万核ECS算力及万卡灵骏智算集群,支撑淘宝推荐等核心业务性能提升超30%。通义千问大模型大规模落地,Qwen-MT单日调用超14亿次,助力商品出海、客服与经营分析,全面赋能双11智能化升级。

247 0
|
1月前
|
人工智能 语音技术 流计算
|

一图掌握通义千问:模型生态与应用场景全览

通义千问(Qwen)系列提供全栈开源AI能力,涵盖语言、视觉、语音等多模态应用。旗舰模型Qwen3-Max性能领先,支持92种语言翻译与高精度语音识别,具备强大代码生成与图像处理能力,助力开发者与企业高效构建智能应用。

371 2
|
3月前
|
存储 机器学习/深度学习 算法
|

​​LLM推理效率的范式转移:FlashAttention与PagedAttention正在重塑AI部署的未来​

本文深度解析FlashAttention与PagedAttention两大LLM推理优化技术:前者通过分块计算提升注意力效率,后者借助分页管理降低KV Cache内存开销。二者分别从计算与内存维度突破性能瓶颈,显著提升大模型推理速度与吞吐量,是当前高效LLM系统的核心基石。建议收藏细读。

708 125
|
12月前
|
自然语言处理 物联网 API
|

使用CAMEL和Unsloth进行数据生成与Qwen模型微调

本项目结合CAMEL和Unsloth,生成高质量训练数据并对Qwen 7B模型进行微调,提升其在特定内容上的理解和生成能力。我们使用CAMEL生成指令-输入-输出三元组数据,并通过Unsloth的LoRA技术加速微调过程。详细步骤包括环境准备、API密钥设置、模型加载与配置、数据生成与保存、模型训练及推理。最终,微调后的Qwen 7B模型能更好地处理CAMEL社区相关文本。 更多详情请参考: - [CAMEL GitHub](https://github.com/camel-ai/camel)

1104 5
|
人工智能 自然语言处理 前端开发
|

从文案到设计,我用通义版Artifacts生成了365张灵感日历

本文介绍了如何利用通义AI的“代码模式”功能,轻松制作个性化日历。作者通过实例展示了从设计日历样式、推荐每日生活小事到赋予小事新解的过程,强调了AI在创意实现上的强大助力。此外,还探讨了AI代码生成技术对未来创造力的影响,以及通义AI代码模式如何降低创作门槛,提高效率,让每个人都能成为应用开发者。

937 2
|
4月前
|
存储 人工智能 自然语言处理
|

告别文字乱码!全新文生图模型Qwen-Image来咯

通义千问团队开源了Qwen-Image,一个20B参数的MMDiT模型,具备卓越的文本渲染和图像编辑能力。支持复杂中英文文本生成与自动布局,适用于多场景图像生成与编辑任务,已在魔搭社区与Hugging Face开源。

800 2
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
|

通义千问推理模型QwQ-32B开源,更小尺寸、更强性能

阿里云发布并开源全新推理模型通义千问QwQ-32B,通过大规模强化学习,在数学、代码及通用能力上实现质的飞跃,性能比肩DeepSeek-R1。该模型大幅降低部署成本,支持消费级显卡本地部署,并集成智能体Agent相关能力。阿里云采用Apache2.0协议全球开源,用户可通过通义APP免费体验。此外,通义团队已开源200多款模型,覆盖全模态和全尺寸。

949 20
|
10月前
|
存储 人工智能 API
|

DeepSeek——DeepSeek模型部署实战

本文介绍了DeepSeek大模型的本地部署方法、使用方式及API接入。首先,通过下载Ollama平台部署DeepSeek-R1模型,提供7种不同参数版本(1.5b至671b),用户可根据硬件选择合适的模型大小。接着,文章详细描述了如何在终端运行命令启动模型,并通过Chatbox官网下载并接入DeepSeek API,实现本地和云端模型的交互。最后,提及了DeepSeek官网和集成工具如POE的使用,帮助用户更好地利用DeepSeek进行开发和应用。

1164 76
|
11月前
|
人工智能 自然语言处理 算法
|

通义智文:文档应用赋能千行百业

通义智文是阿里巴巴推出的大规模文档处理技术体系,旨在提升生产力效率。最初作为阅读工具发布,现已发展为涵盖文档解析、理解、生成等多方面的技术平台。通义智文支持超长文档处理、多模态文本解析,并在法律、教育等领域提供专业服务。其创新算法如VGT版面分析和Layout-LM多模态模型,显著提升了文档处理精度。应用场景包括PPT创作、故事绘本生成及法律文书审查等,赋能千行百业。

1130 2
|
人工智能 关系型数据库 分布式数据库
|

沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力

本文将带领大家来体验一下如何将“千问大模型+文本向量化模型”植入到PG|PolarDB中, 让数据库具备AI能力.

26099 21
|
2月前
|
存储 人工智能 前端开发
|

超越问答:深入理解并构建自主决策的AI智能体(Agent)

如果说RAG让LLM学会了“开卷考试”,那么AI智能体(Agent)则赋予了LLM“手和脚”,使其能够思考、规划并与真实世界互动。本文将深入剖析Agent的核心架构,讲解ReAct等关键工作机制,并带你一步步构建一个能够调用外部工具(API)的自定义Agent,开启LLM自主解决复杂任务的新篇章。

446 6
|
4月前
|
人工智能 算法 前端开发
|

超越Prompt Engineering:揭秘高并发AI系统的上下文工程实践

本文系统解析AI工程范式从Prompt Engineering到Context Engineering的演进路径,深入探讨RAG、向量数据库、上下文压缩等关键技术,并结合LangGraph与智能体系统架构,助力开发者构建高可靠AI应用。

625 2
|
自然语言处理 前端开发 网络协议
|

用 Qwen2.5-Coder 开发一个网页应用,完全0基础,已部署上线,代码开源!

利用Qwen2.5-Coder成功开发了一个简洁实用的网页应用,该应用能够在浏览器Tab标题中显示北京时间,并在页面中集成了实时时间显示和番茄时钟功能。通过Qwen2.5-Coder的强大代码生成能力,从零基础开始,仅需简单提示便完成了HTML、CSS和JavaScript的编写。经过几次优化调整,最终实现了美观且功能完善的网页应用,并顺利部署至Vercel平台,满足了作者在全屏模式下查看时间的需求。

1084 3
|
存储 自然语言处理 搜索推荐
|

大模型 Agent 概述

大模型Agent是基于大型预训练模型构建的智能体,具有强大的语言理解和生成能力,能完成多任务处理。其记忆功能包括短期记忆和长期记忆,支持上下文保持、知识积累、计划决策及内容创作,广泛应用于自然语言处理、问答系统、信息检索、辅助决策、教育、创意应用和客服等领域。

1778 0
|
4月前
|
机器学习/深度学习 存储 人工智能
|

深度解析大模型压缩技术:搞懂深度学习中的减枝、量化、知识蒸馏

本文系统解析深度学习模型压缩三大核心技术:剪枝、量化与知识蒸馏,详解如何实现模型缩小16倍、推理加速4倍。涵盖技术原理、工程实践与组合策略,助力AI模型高效部署至边缘设备。

986 2
|
4月前
|
机器学习/深度学习 存储 算法
|

Trinity-RFT:构建智能体持续学习的自动化强化微调工厂

大型语言模型作为智能体在真实环境中持续交互学习面临诸多挑战。 Trinity-RFT 是通义实验室推出的强化微调框架,旨在实现智能体的持续进化。它通过探索、训练与经验池的解耦设计,支持多样化训练模式,提升资源利用率和学习稳定性。同时,Trinity-RFT 提供灵活的数据处理与算法模块化功能,降低应用与研究门槛,助力迈向终身学习与自主进化的智能体时代。

410 2
|
人工智能 安全 算法
|

【平衡点:解锁中国大模型开源闭源的新时代】关于大模型是否开源的分析

本文探讨了开源与闭源软件在大模型技术发展中的角色,深入比较了两者在质量、安全、产业化、适应性和可靠性等方面的优缺点。开源软件得益于全球开发者社区,通常在创新和适应性上表现出色,但安全性和质量可能因分散的开发而有所波动。闭源软件则在代码质量和安全性上有一定优势,但可能限制了产业的协作与创新。 在商业模式方面,开源通常依赖服务和支持盈利,闭源则通过软件授权和订阅服务获利。开源模式的市场竞争更激烈,闭源模式则更注重市场份额和控制。企业需要根据自身情况选择合适的战略,有些可能会采用

952 1
|
机器学习/深度学习 人工智能 API
|

如何在 TensorRT-LLM 中支持 Qwen 模型

大型语言模型正以其惊人的新能力推动人工智能的发展,扩大其应用范围。然而,由于这类模型具有庞大的参数规模,部署和推理的难度和成本极高,这一挑战一直困扰着 AI 领域。此外,当前存在大量支持模型部署和推理的框架和工具,如  ModelScope 的 Model Pipelines API,和 HuggingFace 的 Text Generation Inference 等,各自都有其独特的特点和优势。然而,这些工具往往未能充分发挥  GPU 的性能。

72457 0
|
2月前
|
机器学习/深度学习 测试技术
|

先SFT后RL但是效果不佳?你可能没用好“离线专家数据”!

通义实验室Trinity-RFT团队提出CHORD框架,通过动态融合SFT与RL,解决大模型训练中“越学越差”“顾此失彼”等问题。该框架引入细粒度Token级权重与软过渡机制,实现从模仿到超越的高效学习,在数学推理与通用任务上均显著提升性能,相关代码已开源。

376 0
|
3月前
|
机器学习/深度学习 缓存 人工智能
|

MoE模型加速秘籍:vLLM混合KV缓存管理解析​

vLLM是高效分布式大模型推理引擎,采用分页注意力、连续批处理等技术实现高吞吐与低延迟。本文详解其架构设计与关键技术,包括KV缓存管理、调度机制、推测解码与分布式扩展等,助你深入理解性能优化原理。

647 1
|
8月前
|
弹性计算 机器人 应用服务中间件
|

一键部署开源Qwen3并集成到钉钉、企业微信

Qwen3系列模型现已正式发布并开源,包含8款“混合推理模型”,其中涵盖两款MoE模型(Qwen3-235B-A22B与Qwen3-30B-A3B)及六个Dense模型。阿里云计算巢已支持Qwen3-235B-A22B和Qwen3-32B的私有化部署,用户可通过计算巢轻松完成部署,并借助AppFlow集成至钉钉机器人或企业微信。文档详细介绍了从模型部署、创建应用到配置机器人的全流程,帮助用户快速实现智能助手的接入与使用。

702 19
|
10月前
|
人工智能 自然语言处理 算法
|

接入DeepSeek需要做算法备案吗?一文读懂算法备案的那些事儿

在AI快速发展的今天,算法备案成为企业合规运营的关键。本文通过五个案例解析接入DeepSeek是否需备案:1) 微调模型需备案,流程4-6个月;2) 面向公众服务需备案;3) 内部使用通常无需备案;4) 个人自用无需备案;5) 面向特定专业人士通常无需备案。了解这些要求,确保企业在享受AI红利的同时合规运营,规避风险。

1529 15
|
算法 机器人 语音技术
|

由通义千问驱动的人形机器人具身智能Multi-Agent系统

申昊科技人形机器人小昊,集成通义千问多模态大模型的具身智能系统,旨在讲解销售、迎宾表演等场景。机器人通过语音、动作等方式与用户互动,利用云端大语言模型处理自然语言,结合视觉、听觉等多模态感知技术,实现流畅的人机对话、目标追踪、展厅讲解等功能。

1356 4
|
人工智能 自然语言处理 API
|

AI大模型 智能AI开源模型与大模型接口整理(8个开源模型+7个大模型接口)

AI大模型 智能AI开源模型与大模型接口整理(8个开源模型+7个大模型接口)

2169 5
|
4月前
|
存储 数据库
|

RAG分块技术全景图:5大策略解剖与千万级生产环境验证

本文深入解析RAG系统中的五大文本分块策略,包括固定尺寸、语义、递归、结构和LLM分块,探讨其工程实现与优化方案,帮助提升知识检索精度与LLM生成效果。

621 1
|
6月前
|
人工智能 自然语言处理 搜索推荐
|

Spark-TTS: AI语音合成的"变声大师"

Spark-TTS 是一款革命性的语音合成模型,被誉为“变声大师”。它通过创新的 BiCodec 技术将语音分解为语义和全局两种 Token,实现对音色、性别、语速等属性的精细控制。结合统一的 LLM 架构,Spark-TTS 简化了传统 TTS 的复杂流程,同时提供了前所未有的灵活性。此外,团队还发布了 VoxBox 开源数据集,为行业提供标准评估基准。尽管在零样本场景下仍存改进空间,但 Spark-TTS 已经开启了语音合成新时代,让个性化、可控的 AI 语音成为可能。

727 5
|
7月前
|
存储 人工智能 安全
|

自媒体创作场景实践|通义千问3 + MCP=一切皆有可能

本文介绍了通过MCP(Model Context Protocol)结合通义千问大模型实现跨平台、跨服务的自动化任务处理方案。使用Qwen3-235B-A22B模型,配合ComfyUI生成图像,并通过小红书等社交媒体发布内容,展示了如何打破AI云服务的数据孤岛。具体实践包括接入FileSystem、ComfyUI和第三方媒体Server,完成从本地文件读取到生成图像再到发布的全流程。 方案优势在于高可扩展性和易用性,但也存在大模型智能化不足、MCP Server开发难度较大及安全风险等问题。未来需进一步提升模型能力、丰富应用场景并解决安全挑战,推动MCP在更多领域落地。

1727 27
|
10月前
|
人工智能 自然语言处理 机器人
|

招商银行X通义大模型,2024年度AI最佳实践案例!

招商银行X通义大模型,2024年度AI最佳实践案例!

830 2
|
存储 人工智能 OLAP
|

LangChain+通义千问+AnalyticDB向量引擎保姆级教程

本文以构建AIGC落地应用ChatBot和构建AI Agent为例,从代码级别详细分享AI框架LangChain、阿里云通义大模型和AnalyticDB向量引擎的开发经验和最佳实践,给大家快速落地AIGC应用提供参考。

131993 94
|
2月前
|
存储 缓存 负载均衡
|

TensorRT LLM 中的并行策略

TensorRT LLM提供多种GPU并行策略,支持大模型在显存与性能受限时的高效部署。涵盖张量、流水线、数据、专家及上下文并行,并推出宽专家并行(Wide-EP)应对大规模MoE模型的负载不均与通信挑战,结合智能负载均衡与优化通信核心,提升推理效率与可扩展性。

464 154
|
2月前
|
人工智能 自然语言处理 前端开发
|

最佳实践2:用通义灵码以自然语言交互实现 AI 高考志愿填报系统

本项目旨在通过自然语言交互,结合通义千问AI模型,构建一个智能高考志愿填报系统。利用Vue3与Python,实现信息采集、AI推荐、专业详情展示及数据存储功能,支持响应式设计与Supabase数据库集成,助力考生精准择校选专业。(239字)

285 12
|
2月前
|
存储 算法 数据库
|

从零到一构建你的第一个检索增强生成应用

本文将带你深入了解检索增强生成(RAG)技术的核心思想,解决大型语言模型(LLM)固有的知识局限和“幻觉”问题。我们将一步步拆解RAG的工作流程,从文档处理到向量检索,并提供一份基于Python的简易代码实现,助你快速上手,构建你的第一个RAG应用。

203 2
|
6月前
|
传感器 人工智能 自然语言处理
|

比亚迪座舱接入通义大模型,未来将联合打造更多AI智能座舱场景

比亚迪与阿里云深度合作,将通义大模型应用于智能座舱和营销服务。通过通义万相,腾势推出“AI壁纸”功能;借助通义星尘,实现“心理伴聊”等情感陪伴场景。阿里云Mobile-Agent智能体落地比亚迪座舱,支持复杂语音操作,如查询淘宝物流、订火车票等。该方案基于全视觉解决技术,具有强泛化能力,未来双方将持续拓展更多AI应用。

848 9
|
7月前
|
人工智能 弹性计算 智能设计
|

🎨 三步打造AI创意工坊 | 通义万相图像生成服务极速部署指南

🚀 从零到大师 | 通义万相智能创作系统部署指南

1201 146
|
9月前
|
人工智能 自然语言处理 供应链
|

万码优才联合阿里云通义千问破解“人岗错配”困局

2025年3月11日,浙江万有码力网络科技有限公司(以下简称“万码优才”)与阿里云计算有限公司(以下简称“阿里云”)在杭州云谷园区正式签署合作协议。双方宣布将基于阿里云通义大模型与万码优才第三代AI招聘平台,共同打造“云智人才生态引擎”,推动人力资源服务从“效率工具”向“基础设施”升级。

506 2
|
10月前
|
人工智能 机器人 API
|

搞定!微信接入DeepSeek打造聊天机器人,1行代码就行!

程序员晚枫分享了一个有趣的Python项目,将DeepSeek大模型接入微信,实现自动聊天。通过PyOfficeRobot库,仅需1行代码即可完成接入,打造AI聊天机器人。该项目基于Windows API操作微信,目前仅支持Windows系统。用户需填写好友名称和API Key,轻松体验AI对话。此外,PyOfficeRobot还支持其他大模型如阿里通义、智谱等。欢迎尝试并参与改进开源项目。

1445 81
|
人工智能 JSON API
|

利用TTS技术让你的AI Agent发声

【10月更文挑战第5天】

853 4

通义大模型

阿里云自主研发的通义大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

0
今日
1560
内容
8
活动
1056
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大模型服务平台百炼