|
2月前
|
存储 机器学习/深度学习 人工智能
|

大模型应用:大模型本地部署的磁盘空间优化:模型分片存储与按需加载.48

本文详解大模型本地部署的磁盘与显存优化方案:通过分片存储(将大模型切分为多个小文件)与按需加载(运行时动态加载所需分片),显著降低硬件门槛。以Qwen1.5-1.8B为例,完整演示分片生成、索引构建、完整性校验、加载测试及跨分区部署,确保效果不降、资源占用大减。

605 20
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

构建AI智能体:六十一、信息论完全指南:从基础概念到在大模型中的实际应用

摘要: 信息论是人工智能尤其是大语言模型的核心数学工具。本文系统介绍了八大核心概念: 信息量:衡量事件意外程度,公式为I(x)=-log₂P(x) 信息熵:评估系统不确定性,H(X)=-ΣP(x)log₂P(x) 联合熵/条件熵:分析多变量关系及条件不确定性 互信息:量化变量间共享信息量 KL散度:衡量概率分布差异 交叉熵:模型训练的核心损失函数 在大语言模型中,这些概念被广泛应用于: 训练阶段:交叉熵优化预测,KL散度防止过拟合 推理阶段:温度参数调节生成文本的创造性(高熵增加多样性)

781 2
|
5月前
|
JSON 人工智能 安全
|

Qwen Code 能力再升级

Qwen Code v0.3.0 正式发布!全面支持 Stream JSON、多语言界面切换,提升安全稳定与生态适配,助力开发者高效构建 AI 工具。欢迎体验并参与共建!

972 1
|
9月前
|
SQL 人工智能 Java
|

用 LangChain4j+Ollama 打造 Text-to-SQL AI Agent,数据库想问就问

本文介绍了如何利用AI技术简化SQL查询操作,让不懂技术的用户也能轻松从数据库中获取信息。通过本地部署PostgreSQL数据库和Ollama模型,结合Java代码,实现将自然语言问题自动转换为SQL查询,并将结果以易懂的方式呈现。整个流程简单直观,适合初学者动手实践,同时也展示了AI在数据查询中的潜力与局限。

1227 8
|
11月前
|
人工智能 API 开发者
|

智能体(AI Agent)开发实战之【LangChain】(一)接入大模型输出结果

LangChain 是一个开源框架,专为构建与大语言模型(LLMs)相关的应用设计。通过集成多个 API、数据源和工具,助力开发者高效构建智能应用。本文介绍了 LangChain 的环境准备(如安装 LangChain、OpenAI 及国内 DeepSeek 等库)、代码实现(以国内开源大模型 Qwen 为例,展示接入及输出结果的全流程),以及核心参数配置说明。LangChain 的灵活性和强大功能使其成为开发对话式智能应用的理想选择。

2435 1
|
人工智能 达摩院 搜索推荐
|

通义大模型:解码中国AI的"通"与"义"

“通义”取自中国传统文化中“通晓大义”,寓意技术与人文的结合。作为阿里巴巴旗下的超大规模语言模型,通义在知识蒸馏、动态稀疏激活和文化感知模块上实现三大突破,大幅提升效率与适切性。其已在医疗、司法、文化传播等领域落地,如辅助病历处理、法律文书生成及文物解说等。测试显示,通义在中文诗歌创作、商业报告生成等方面表现优异。同时,开放的开发者生态已吸引5万+创新者。未来,通义将探索长期记忆、自我反思及多智能体协作,向AGI迈进,成为智能本质的载体。其对中文语境情感的精准把握,更是中国AI“通情达义”的典范。

3861 22
|
人工智能 API Python
|

三分钟快速搭建基于FastAPI的AI Agent应用!

【10月更文挑战第1天】

1945 0
|
1月前
|
存储 自然语言处理 安全
|

大模型应用:医疗行业大模型:从生成前校验到生成后审计的应用实践.73

本文提出医疗大模型“生成前校验+生成后审计”全链路管控方案,通过输入完整性/合规性校验、隐私脱敏、标准化处理,及输出格式/准确性/隐私审计等闭环流程,确保病历撰写、医嘱辅助等场景安全、合规、准确落地。

396 7
|
2月前
|
机器学习/深度学习 存储 运维
|

大模型应用:大模型权重敏感性分析:L1/L2 范数、梯度贡献深入解读.39

本文系统讲解大模型权重敏感性:即权重微小变化对模型输出的影响程度。核心依据是“静态潜力”(L1/L2范数)与“动态贡献”(梯度范数),二者结合可精准识别高敏感(需保护/精细调优)与低敏感(可剪枝/量化)权重,支撑模型压缩、加速与稳定性优化。

570 2
|
3月前
|
人工智能 算法 搜索推荐
|

算法备案必看:多产品≠多备案!被驳回的 “重复申请” 坑一次讲清

AI企业多产品算法备案常陷“重复申请”误区。本文揭秘:同主体、同算法仅场景不同,只需1份备案,关联多个产品即可;唯算法类型/原理不同时才需分开。附命名规范、填报要点与避坑指南,助您一次过审。(239字)

327 14
|
3月前
|
机器学习/深度学习 自然语言处理 定位技术
|

大模型应用:循序渐进掌握CLIP:领悟训练推理过程的进阶特性.17

本文系统解析CLIP模型:从跨模态对比学习原理、零样本能力本质,到双塔架构、训练机制(InfoNCE损失、温度参数τ)与推理应用(分类/检索/标注),辅以多模板提示工程等实战技巧,揭示其“用图文相关性替代任务学习”的核心思想。

593 10
|
4月前
|
存储 消息中间件 人工智能
|

【架构模式】解构多智能体协作:AI Agent “指挥官”与“调度官”的双层治理实践

本文提出“指挥官-调度官”双层架构,解决多智能体系统中的意图漂移、死循环与资源竞争问题。通过职能分离,实现高并发、高可用的复杂任务协同。

713 3
|
4月前
|
人工智能 JavaScript API
|

【教案生成平台】实战教程二:接入 AI 大模型实现智能教案生成

一款基于 Vue 3 + Vite 的教师辅助工具,聚焦教案智能生成。输入课程主题,AI 流式输出完整教学设计,支持 Markdown 实时预览与 Word 导出,提升备课效率。核心技术涵盖流式 API 调用、提示词工程与文档生成,构建从输入到输出的完整 AI 工作流。

674 8
|
4月前
|
存储 人工智能 自然语言处理
|

智能体领航员——深度解析 AI 驱动的企业级知识库搭建全流程

智能体运用场景

1074 0

通义千问Image模型使用指南

该表格展示了多个设计场景,包括模型选择、复制粘贴提示词、一键生图等步骤。每个步骤配有详细描述及示意图,呈现了不同主题如商业海报、IP主视觉、品牌包装、街拍风格等的设计构思与实现方式。

2435 1
|
9月前
|
人工智能 算法 安全
|

算法备案新手攻略——2025全网最新最详细解读版

本文介绍了算法备案的背景、法规依据、备案类型及流程,涵盖生成合成、个性化推送等五大算法类型,并详细说明所需材料与备案周期,强调未备案将面临行政处罚甚至刑事追责,助力企业合规运营。

953 1
|
编解码 人工智能
|

通义万相Wan2.1-VACE开源!业内首个视频编辑统一模型!附推理教程

通义万相Wan2.1-VACE开源!业内首个视频编辑统一模型!附推理教程

2516 7
|
小程序 API 开发工具
|

支付宝支付对接案例详解

支付宝支付对接指南,涵盖电脑网站、当面付和手机网站支付方式。对接前需了解支付宝开放平台和商家平台的区别,完成注册、实名认证、创建应用及签约产品等步骤。配置支付环境包括API密钥、回调地址和开发环境搭建。提供三种SDK供选择,推荐使用alipay-easysdk。详细步骤和示例代码可参考官方文档。

1748 15
|
人工智能 并行计算 监控
|

深入剖析 Qwen2.5 - 32B 模型在 VLLM 上的单机三卡部署与运行

本文深入探讨了Qwen2.5 - 32B模型在VLLM框架上的部署过程,从模型下载、启动命令、资源占用分析到GPU资源分配及CUDA图应用,详述了大模型运行的挑战与优化策略,强调了硬件资源规划与技术调优的重要性。

8769 2
|
Java 编译器 测试技术
|

全面理解Maven Compiler Plugin-Maven编译插件

【10月更文挑战第16天】

4046 1
|
人工智能 编解码 机器人
|

通义千问,又开源了!

通义千问,又开源了!

53026 66
|
人工智能
|

免费、可商用,阿里云开源70亿参数通义千问大模型

免费、可商用,阿里云开源70亿参数通义千问大模型

7541 0
|
21天前
|
存储 人工智能 算法
|

102.大模型应用:差分隐私与大模型融合:数据隐私保护与模型效能的应用实践.102

本文系统阐述差分隐私(DP)如何破解大模型训练中的“数据不出库”与“模型需高质量数据”矛盾。通过在数据或梯度中添加可控噪声,DP在保障个体隐私(ε-δ严格可证)前提下,保留统计有效性,结合联邦学习实现医疗、金融等敏感场景的合规建模,兼顾隐私安全、数据可用与模型效能。

189 1
|
2月前
|
机器学习/深度学习 监控 安全
|

再也不怕局部拍屏泄露:一项能抗部分屏幕拍摄的溯源黑科技来了(第10期)

针对“拍屏截取局部”导致传统水印失效的难题,合肥高维数据与中科大联合研发《抗部分屏幕拍摄的溯源水印方法》,首创结构化水印+双阶段深度学习增强技术,支持畸变、裁剪、摩尔纹等复杂干扰下的高鲁棒溯源,已应用于政企保密、版权保护与司法取证等领域。(239字)

327 2
|
4月前
|
人工智能 开发者
|

Qwen-Image又登顶啦!

Qwen-Image-2512登顶Hugging Face趋势榜榜首,并在AI Arena稳居最强开源图像模型!新发布的Qwen-image-edit-202511也在Chatbot Arena获开源第一、全球第九。双榜佳绩,技术再突破!

762 0
|
存储 人工智能 安全
|

自媒体创作场景实践|通义千问3 + MCP=一切皆有可能

本文介绍了通过MCP(Model Context Protocol)结合通义千问大模型实现跨平台、跨服务的自动化任务处理方案。使用Qwen3-235B-A22B模型,配合ComfyUI生成图像,并通过小红书等社交媒体发布内容,展示了如何打破AI云服务的数据孤岛。具体实践包括接入FileSystem、ComfyUI和第三方媒体Server,完成从本地文件读取到生成图像再到发布的全流程。 方案优势在于高可扩展性和易用性,但也存在大模型智能化不足、MCP Server开发难度较大及安全风险等问题。未来需进一步提升模型能力、丰富应用场景并解决安全挑战,推动MCP在更多领域落地。

3082 27
|
机器学习/深度学习 编解码 缓存
|

通义万相2.1首尾帧模型开源!细节真实生动+过渡丝滑,指令遵循表现出色!

通义万相2.1首尾帧模型开源!细节真实生动+过渡丝滑,指令遵循表现出色!

1819 7
|
前端开发 机器人 API
|

前端大模型入门(一):用 js+langchain 构建基于 LLM 的应用

本文介绍了大语言模型(LLM)的HTTP API流式调用机制及其在前端的实现方法。通过流式调用,服务器可以逐步发送生成的文本内容,前端则实时处理并展示这些数据块,从而提升用户体验和实时性。文章详细讲解了如何使用`fetch`发起流式请求、处理响应流数据、逐步更新界面、处理中断和错误,以及优化用户交互。流式调用特别适用于聊天机器人、搜索建议等应用场景,能够显著减少用户的等待时间,增强交互性。

5155 2
|
16天前
|
人工智能 编解码 移动开发
|

Windows 部署 OpenClaw 借助本地 AI 快速搭建静态企业站点

本文详解如何用本地离线AI工具OpenClaw,零代码快速搭建企业静态网站:从一键部署、自然语言生成HTML/CSS/JS源码,到本地调试与上线部署,全流程30分钟搞定,安全可控、高度定制。(239字)

115 0
|
3月前
|
前端开发 数据可视化 API
|

大模型应用:完整语音交互闭环:TTS+ASR融合系统可视化场景实践.22

本文介绍了一个轻量级TTS+ASR融合交互系统,基于HTML/CSS/JS前端与Python Flask后端,集成Whisper语音识别与pyttsx3文本转语音,实现“语音→文本→语音”闭环。支持浏览器录音、实时转写、语音播放及历史管理,无需依赖框架或网络,适合快速部署与二次开发。

582 18
|
7月前
|
数据采集 人工智能 物联网
|

国产AI封神!炒股狂赚40%碾压对手 教你微调Qwen3打造专属金融分析师

国产AI在实盘炒股中大放异彩,DeepSeek与Qwen3收益率最高超60%,碾压国际大模型。本文教你用LLaMA Factory平台微调Qwen3-VL-30B,打造专属多模态金融分析师,实现趋势研判、财报分析等专业能力,赋能投资决策。

2105 157
|
8月前
|
机器学习/深度学习 缓存 人工智能
|

MoE模型加速秘籍:vLLM混合KV缓存管理解析​

vLLM是高效分布式大模型推理引擎,采用分页注意力、连续批处理等技术实现高吞吐与低延迟。本文详解其架构设计与关键技术,包括KV缓存管理、调度机制、推测解码与分布式扩展等,助你深入理解性能优化原理。

1511 1
|
9月前
|
人机交互 API 开发工具
|

基于通义多模态大模型的实时音视频交互

Qwen-Omni是通义千问系列的全新多模态大模型,支持文本、图像、音频和视频的输入,并输出文本和音频。Omni-Realtime服务针对实时交互场景优化,提供低延迟的人机交互体验。

1697 23
|
测试技术 API 开发者
|

LiveBench放榜:Qwen3斩获全球开源冠军

最新一期LiveBench榜单显示,阿里云旗舰模型Qwen3-235B-A22B荣登全球开源模型冠军,小尺寸Qwen3-32B位列Top3。千问3在指令遵循能力上超越多个顶级闭源模型,位居全球第一。该评测由图灵奖得主Yann LeCun发起,采用动态防污染机制,确保公平性。千问3支持119种语言,具备混合推理架构与强大Agent能力,现已上线阿里云百炼平台,提供免费体验与API调用。

1132 10
|
机器学习/深度学习 人工智能 算法
|

算法备案全流程实操

随着《生成式人工智能服务管理暂行办法》在2024年实施,算法备案成为强制性要求。未合规将导致APP下架或高额罚款。本文详解算法备案的核心逻辑与流程,涵盖必备案算法类型、三大监管红线、六大阶段的关键节点,并提供阿里云工具支持,如合规预评估平台和备案助手插件。内容包括金融风控算法的可解释性要求、生成式AI的内容安全措施及个人开发者的技术能力证明方法,助力开发者实现持续合规。

1705 4
|
人工智能 API C++
|

【AI绘画大比拼】通义万相VS文心一格:探索十种风格下的绘画生成差异!

近日,通义大模型家族的新成员——通义万相已在人工智能大会上亮相。其中,通义万相的强大的“文生图”功能,不禁让我想到了去年八月由百度依托飞桨、文心大模型的技术创新推出的“AI作画”首款产品——文心一格。 那么,在类似的Prompt下,两款产品的表现将会如何呢?今天就让我们就十种风格下二者生成图像的表现力,来看看这两款产品的差异。

6296 8
|
1月前
|
机器学习/深度学习 自然语言处理 算法
|

大模型应用:从语义理解到最优匹配:大模型赋能的二分图匈牙利算法全解析.93

本文详解“大模型+匈牙利算法(KM)”融合的智能匹配技术:大模型负责语义理解与对齐,将非结构化文本(如岗位描述、简历)转化为0–100分量化权重;KM算法在此基础上求解带权二分图的全局最优匹配。该方案突破人工规则局限,实现精准、自适应、跨场景的智能配对,广泛适用于人岗匹配、题库组卷、客服问答等核心业务。

214 10
|
1月前
|
人工智能 自然语言处理 数据可视化
|

阿里云智启AI活动:超7000万大模型tokens免费体验,加速AI应用落地

阿里云启动智启AI活动内容参考,活动推出Qwen3.5全模型,最低4.5折优惠,让AI无缝理解多模态输入。其中,Qwen3.5-Omni具备Vibe Coding能力,可一键生成代码;Qwen3.5-Plus性能卓越,实现底层模型架构的全面革新。此外,阿里云还提供开箱即用的大模型创新场景和AI应用,如电商营销、广告创作等。活动还提供先进、弹性的AI算力,支持快速部署千问大模型。

503 6
|
2月前
|
并行计算 监控 PyTorch
|

大模型应用:大模型算力优化方案:识别突破隐性瓶颈达到效能最大化.65

本文深度剖析大模型落地中“算力跑不满”的隐性瓶颈,从系统(CUDA/驱动/OS)、模型(注意力冗余、激活函数、权重稀疏)、数据(加载、分词、格式)三维度拆解,并提供量化评估方法与场景化优化方案(个人开发/企业推理/边缘部署),助力榨干硬件潜力。

549 5
|
2月前
|
存储 自动驾驶 物联网
|

大模型应用:高精度量化感知训练(QAT)与低成本后训练量化(PTQ)方案优选.55

本文深入解析大模型量化两大核心技术:后训练量化(PTQ)与量化感知训练(QAT)。涵盖原理、流程、代码实现及选型策略,对比其在精度损失、算力成本、部署效率等方面的差异,助开发者根据数据、算力与精度需求,科学选择最优量化方案。

449 15
|
2月前
|
人工智能 数据库 知识图谱
|

医疗垂直领域生成式搜索优化(GEO):基于 RAG 与知识图谱的召回增强架构实战

本文提出医疗垂直领域生成式搜索优化(GEO)新范式,融合Schema结构化标记、知识图谱映射与RAG召回增强技术,显著提升非公医疗机构信息的有效召回率与语义一致性。实测显示mAP提升225%,事实一致性达98.5%。(239字)

286 5
|
4月前
|
人工智能 自然语言处理 监控
|

多智能体如何高效协作?AI Agent指挥官与AI调度官的实践方法

本文提出AI Agent“指挥官+调度官”协同治理机制,通过角色分离、统一调度与规则约束,解决多智能体系统中的任务冲突、资源争抢与决策分散问题,提升复杂场景下的可扩展性、稳定性与可解释性。

588 3
|
4月前
|
人工智能 JSON 调度
|

架构设计实践:如何构建基于 LLM 的 AI Agent "指挥官" (Commander) 模式

本文提出一种基于“指挥官(Commander)”的中心化调度架构,解决多Agent协作中的循环沟通、目标漂移等问题。通过Prompt工程与状态机设计,实现任务拆解、分发与验收,并结合阿里云百炼平台与通义千问模型,提供可落地的代码级实现方案,构建稳定可控的AI多智能体系统。(238字)

482 3
|
4月前
|
人工智能 架构师 安全
|

后大模型时代:从 Model 到 Agent,下一代企业级应用架构演进指南

摘要:当大模型(LLM)的能力逐渐同质化,基于 Agent(智能体)的应用架构正在成为新的技术护城河。本文将探讨 Agent 如何重构软件开发范式,并梳理开发者在这一转型过程中所需的关键技术栈。

504 2
|
5月前
|
人工智能 安全 前端开发
|

写单元测试太痛苦?教你用DeepSeek/通义千问一键生成高质量测试代码

单元测试难写且枯燥?本文分享一套经过验证的AI生成指令,将DeepSeek/通义千问化身为10年经验的测试专家。支持自动Mock、全场景覆盖和参数化测试,让代码质量保障从"体力活"变成高效的"指挥活"。

1194 3
|
6月前
|
人工智能 语音技术 流计算
|

一图掌握通义千问:模型生态与应用场景全览

通义千问(Qwen)系列提供全栈开源AI能力,涵盖语言、视觉、语音等多模态应用。旗舰模型Qwen3-Max性能领先,支持92种语言翻译与高精度语音识别,具备强大代码生成与图像处理能力,助力开发者与企业高效构建智能应用。

1061 2
|
7月前
|
人工智能 自然语言处理 数据可视化
|

多模态AI重构科研范式:从"读文献"到"理解世界"

2025年,多模态AI正重塑科研:可同时理解文字、图像、公式等,实现文献智能解析、数据自动提取与跨学科融合,大幅提升研究效率。AI助力科研进入“人机协同”新时代,释放创造力,推动知识发现跃迁。

798 3
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AIGC技术深度解析:生成式AI的革命性突破与产业应用实战

蒋星熠Jaxonic,AI技术探索者,深耕生成式AI领域。本文系统解析AIGC核心技术,涵盖Transformer架构、主流模型对比与实战应用,分享文本生成、图像创作等场景的实践经验,展望技术趋势与产业前景,助力开发者构建完整认知体系,共赴AI原生时代。

1491 2
|
10月前
|
API vr&ar 索引
|

1张照片 2秒钟 一键变身3D数字人

LHM是一种基于单视角图像的端到端Transformer模型,结合SMPL-X人体模型与高斯渲染技术,可从一张照片生成可驱动的3D数字人。它采用Vision Transformer和Mae模型提取特征,并通过Body-Head Transformer融合2D与3D信息,输出具有动作能力的高精度3D人体模型。应用于动作重现、游戏角色生成及虚拟现实等领域,代码已开源并提供在线体验入口。

1331 1
|
机器学习/深度学习 人工智能 自然语言处理
|

AI大模型企业应用实战-什么是zero-shot, one-shot和few-shot Learning

【8月更文挑战第17天】

2430 0

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

3
今日
1956
内容
8
活动
1408
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大模型服务平台百炼