|
5月前
|
机器学习/深度学习 人工智能 测试技术
|

探索 Qwen2.5-Max 的智能:大规模 MoE 模型的飞跃

Qwen2.5-Max 是通义实验室推出的最先进MoE模型,在推理、知识和代码任务中表现卓越,已在超20万亿token上预训练,并通过SFT和RLHF优化。在多项基准测试中领先,如Arena-Hard达89.4,MMLU-Pro为76.1,性能超越DeepSeek V3、GPT-4o等模型,成为当前最佳开源模型。可通过Qwen Chat和API使用,适用于开发者、研究者及AI爱好者探索前沿AI能力。

700 2
|
5月前
|
存储 人工智能 资源调度
|

MCP协议深度集成:生产级研究助手架构蓝图

本文详解基于LangGraph与MCP协议构建研究助手的技术方案,涵盖双服务器集成、状态化智能体设计与用户元命令控制,助你掌握生产级代理系统开发要点。

524 1
|
6月前
|
人工智能 自然语言处理 安全
|

大模型备案材料—《安全评估报告》撰写指南

本文详解大模型备案中的关键材料——《安全评估报告》的撰写要点,涵盖报告框架、必备内容、注意事项及基础信息,助你高效通过备案。

932 6
|
8月前
|
数据采集 自然语言处理 调度
|

优化通义大模型推理性能:企业级场景下的延迟与成本削减策略

本文基于金融、电商、医疗等领域的实战经验,深入探讨通义千问等大模型的推理优化技术栈。从计算图优化、批处理策略、量化压缩到系统架构四个维度展开,结合Python代码示例与压力测试数据,提供企业级解决方案。针对延迟敏感、高吞吐及成本敏感场景,分析性能瓶颈并提出算子融合、动态批处理、混合精度量化等方法,同时设计分布式推理架构与冷启动优化策略。通过案例展示,如电商大促场景优化,实现峰值QPS提升6.5倍、P99延迟降低53%、月度成本下降62%。文章还提供优化实施路线图,助力企业分阶段落地技术方案。

973 5
|
9月前
|
IDE JavaScript 开发工具
|

如何在通义灵码里使用 MCP 能力

通义灵码支持MCP工具使用,通过模型自主规划实现工具调用,深度集成魔搭MCP广场,涵盖2400+热门服务。提供STDIO和SSE两种通信模式,适用于不同场景需求。用户可通过智能体模式调用MCP工具,完成如网页内容抓取、天气查询等任务。文档详细介绍了服务配置、使用流程及常见问题解决方法,助力开发者高效拓展AI编码能力。

1359 43
|
12月前
|
人工智能 机器人 API
|

搞定!微信接入DeepSeek打造聊天机器人,1行代码就行!

程序员晚枫分享了一个有趣的Python项目,将DeepSeek大模型接入微信,实现自动聊天。通过PyOfficeRobot库,仅需1行代码即可完成接入,打造AI聊天机器人。该项目基于Windows API操作微信,目前仅支持Windows系统。用户需填写好友名称和API Key,轻松体验AI对话。此外,PyOfficeRobot还支持其他大模型如阿里通义、智谱等。欢迎尝试并参与改进开源项目。

1804 81
|
人工智能 算法 搜索推荐
|

算法备案全流程攻略:保姆级教程

在AI热潮下,算法成为互联网服务的核心驱动力,但也带来了大数据杀熟、算法歧视等问题。为规范行业发展,算法备案制度应运而生。该制度涵盖网站、APP等多种产品形式,要求企业在2个月内完成备案,依据《互联网信息服务算法推荐管理规定》等法规。未备案企业可能面临无法上线、罚款甚至刑罚的后果。备案流程包括注册、主体备案、信息填报及审核,确保算法合规运营。通过悬挂备案号、标识AI生成内容和定期自查,企业需持续维护算法安全与合规。

1708 14
|
人工智能 自然语言处理 数据库
|

基于RAG和LLM的水利知识问答系统研究

随着全球水资源紧张加剧,我国面临严峻的水资源管理挑战。《十四五规划》提出构建智慧水利体系,通过科技手段提升水情测报和智能调度能力。基于大语言模型(LLM)的水利智能问答系统,利用自然语言处理技术,提供高效、准确的水利信息查询和决策支持,助力水资源管理智能化。该系统通过RAG技术和Agent功能,实现了对水利知识的深度理解和精准回答,适用于水利知识科普、水务治理建议及灾害应急决策等多个场景,推动了水利行业的信息化和智能化发展。

1451 1
|
人工智能 API C++
|

【AI绘画大比拼】通义万相VS文心一格:探索十种风格下的绘画生成差异!

近日,通义大模型家族的新成员——通义万相已在人工智能大会上亮相。其中,通义万相的强大的“文生图”功能,不禁让我想到了去年八月由百度依托飞桨、文心大模型的技术创新推出的“AI作画”首款产品——文心一格。 那么,在类似的Prompt下,两款产品的表现将会如何呢?今天就让我们就十种风格下二者生成图像的表现力,来看看这两款产品的差异。

5841 8
|
开发者
|

你搜到的这些“通义千问”,都是假的!

你搜到的这些“通义千问”,都是假的!

607 0
|
人工智能 达摩院 自然语言处理
|

覆盖200+服务场景,阿里「通义」大模型系列打造国内首个AI统一底座(2)

覆盖200+服务场景,阿里「通义」大模型系列打造国内首个AI统一底座

4152 0
|
21天前
|
人工智能 并行计算 算法框架/工具
|

英伟达三大AI法宝:CUDA、NVLink、InfiniBand——构筑AI时代的算力基石

英伟达三大AI法宝——CUDA(编程层)、NVLink(芯片互连)、InfiniBand(系统互连),构成软硬协同的全栈加速体系:CUDA释放GPU通用算力,NVLink实现多卡高速协同,InfiniBand支撑万卡集群高效通信,共同筑就AI时代的算力基石。(239字)

180 1
|
25天前
|
人工智能 架构师 安全
|

后大模型时代:从 Model 到 Agent,下一代企业级应用架构演进指南

摘要:当大模型(LLM)的能力逐渐同质化,基于 Agent(智能体)的应用架构正在成为新的技术护城河。本文将探讨 Agent 如何重构软件开发范式,并梳理开发者在这一转型过程中所需的关键技术栈。

138 2
|
25天前
|
人工智能 自然语言处理 供应链
|

跨越技术鸿沟:围绕 Coze 实践,西南地区 AI 智能体课程体系的深度构建思路

聚焦西南产业需求,以Coze平台为载体,构建从基础认知到工程落地的AI智能体四阶课程体系。融合文旅、餐饮、制造等真实场景,培养具备结构化思维、工作流编排与RAG优化能力的实战型人才,推动AI从“能用”走向“长期跑”,助力区域产业升级。

101 6
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
|

构建AI智能体:九十一、大模型三大适应技术详解:有监督微调、提示学习与语境学习

大模型应用并非高不可攀,有监督微调、提示学习与语境学习提供了低门槛落地路径。提示学习通过指令引导模型,零成本快速试用;语境学习借助示例让模型“即学即用”;有监督微调则通过数据训练打造专业模型,实现性能突破。三者层层递进,助力高效构建AI应用。

163 14
|
3月前
|
人工智能 UED 开发者
|

别把问卷做成"审讯录":用AI重构与用户的每一次对话

95%的用户调研问卷因为"审讯式提问"而被无视。本文提供一套基于认知心理学的AI指令,将枯燥的填表转化为有温度的对话,帮助开发者和产品经理设计出高完成率、高信度的调研问卷,打破"幸存者偏差",获取真实用户洞察。

316 9
|
4月前
|
存储 缓存 负载均衡
|

TensorRT LLM 中的并行策略

TensorRT LLM提供多种GPU并行策略,支持大模型在显存与性能受限时的高效部署。涵盖张量、流水线、数据、专家及上下文并行,并推出宽专家并行(Wide-EP)应对大规模MoE模型的负载不均与通信挑战,结合智能负载均衡与优化通信核心,提升推理效率与可扩展性。

698 154
|
4月前
|
人工智能 安全 人机交互
|

溯源技术革命:新型数字水印如何让数据“开口说话”,指认泄密源头?

当敏感信息遭偷拍、打印外泄或录音外传,隐形数字水印如“数据守护者”悄然溯源,精准锁定泄密源头。跨屏幕、纸质、音视频等多介质,实现“电-光-电”“电-纸-电”“电-空-电”全链路追踪。从军工到金融,从会议到协作,水印技术正构筑数据安全“最后一公里”防线。AIGC时代,更将融合AI与区块链,守护数字真实性。

489 3
|
6月前
|
SQL 人工智能 Java
|

用 LangChain4j+Ollama 打造 Text-to-SQL AI Agent,数据库想问就问

本文介绍了如何利用AI技术简化SQL查询操作,让不懂技术的用户也能轻松从数据库中获取信息。通过本地部署PostgreSQL数据库和Ollama模型,结合Java代码,实现将自然语言问题自动转换为SQL查询,并将结果以易懂的方式呈现。整个流程简单直观,适合初学者动手实践,同时也展示了AI在数据查询中的潜力与局限。

783 8
|
6月前
|
人工智能 算法 前端开发
|

超越Prompt Engineering:揭秘高并发AI系统的上下文工程实践

本文系统解析AI工程范式从Prompt Engineering到Context Engineering的演进路径,深入探讨RAG、向量数据库、上下文压缩等关键技术,并结合LangGraph与智能体系统架构,助力开发者构建高可靠AI应用。

873 2
|
6月前
|
人工智能 缓存 Kubernetes
|

几大AI知识库致命坑点:避开它们,少走3个月弯路!

本文详解AI知识库在企业中的应用,涵盖架构设计、文档处理、工作流优化与性能调优等核心技术,结合实际案例帮助读者避开落地过程中的常见陷阱,适合希望提升AI应用能力的技术人员阅读。

613 2
|
6月前
|
人工智能 自然语言处理 前端开发
|

AI 调酒师上岗!Qwen3-Coder × 通义灵码完成 AI 调酒师项目实战开发

本课程通过“AI调酒师”项目实战,讲解如何使用通义灵码与Qwen3-Coder模型结合阿里云百炼平台,从需求分析、前端界面搭建、后端服务调用到整体部署的全流程开发。内容涵盖Bento UI设计、Tailwind CSS布局、语音识别与大模型内容生成,并结合MCP服务实现设计稿驱动开发,帮助开发者快速构建趣味AI应用,提升产品落地能力。

678 33
|
6月前
|
存储 数据库
|

RAG分块技术全景图:5大策略解剖与千万级生产环境验证

本文深入解析RAG系统中的五大文本分块策略,包括固定尺寸、语义、递归、结构和LLM分块,探讨其工程实现与优化方案,帮助提升知识检索精度与LLM生成效果。

906 1
|
7月前
|
机器学习/深度学习 人工智能 编解码
|

AI-Compass LLM合集-多模态模块:30+前沿大模型技术生态,涵盖GPT-4V、Gemini Vision等国际领先与通义千问VL等国产优秀模型

AI-Compass LLM合集-多模态模块:30+前沿大模型技术生态,涵盖GPT-4V、Gemini Vision等国际领先与通义千问VL等国产优秀模型

634 6
|
7月前
|
存储 缓存 资源调度
|

# Qwen3-8B 与 ChatGPT-4o Mini 的 TTFT 性能对比与底层原理详解

Qwen3-8B 是通义实验室推出的80亿参数模型,支持32K上下文,采用FP8量化和CUDA优化,提升推理效率;ChatGPT-4o Mini 为OpenAI轻量模型,参数约3.8B,支持128K上下文,通过蒸馏技术实现低延迟。两者在TTFT、长文本处理和部署优化上各有优势,适用于不同应用场景。

1357 9
|
8月前
|

TortoiseSVN使用-TortoiseSVN更换或重置登录用户

TortoiseSVN使用-TortoiseSVN更换或重置登录用户

573 5
|
10月前
|
自然语言处理 测试技术 Serverless
|

Qwen3开源发布:Think Deeper, Act Faster!社区推理、部署、微调、MCP调用实战教程来啦!

Qwen3开源发布:Think Deeper, Act Faster!社区推理、部署、微调、MCP调用实战教程来啦!

2585 22
|
11月前
|
人工智能 自然语言处理 供应链
|

万码优才联合阿里云通义千问破解“人岗错配”困局

2025年3月11日,浙江万有码力网络科技有限公司(以下简称“万码优才”)与阿里云计算有限公司(以下简称“阿里云”)在杭州云谷园区正式签署合作协议。双方宣布将基于阿里云通义大模型与万码优才第三代AI招聘平台,共同打造“云智人才生态引擎”,推动人力资源服务从“效率工具”向“基础设施”升级。

727 2
|
12月前
|
人工智能 API 开发者
|

通过宏实现Word接入DeepSeek

本文介绍如何在Microsoft Word中通过宏接入DeepSeek,实现自动化文本处理。首先确保具备Word 2016及以上版本、DeepSeek API密钥和VBA基础。接着,从豆包平台获取API密钥及模型ID,并在Word中启用开发者选项和宏功能。最后,编写VBA宏代码调用DeepSeek API,完成文本分析与处理。

853 0
|
Web App开发 人工智能 数据安全/隐私保护
|

Microsoft Edge 插件上架发布全流程指南

在前两篇文章中,我分别讲解了如何将产品上架到 Chrome Web Store 和 Firefox Add-ons。今天,我们将继续探索另一个重要的浏览器插件市场——Microsoft Edge 插件商店。如果你已经熟悉 Chrome 和 Firefox 插件的上架流程,那么这篇文章会让你更快上手 Edge 插件的发布。同时,我也会在关键环节与 Chrome 和 Firefox 进行对比,帮助你更好地理解三者的异同。

816 9
|
人工智能 自然语言处理 前端开发
|

从文案到设计,我用通义版Artifacts生成了365张灵感日历

本文介绍了如何利用通义AI的“代码模式”功能,轻松制作个性化日历。作者通过实例展示了从设计日历样式、推荐每日生活小事到赋予小事新解的过程,强调了AI在创意实现上的强大助力。此外,还探讨了AI代码生成技术对未来创造力的影响,以及通义AI代码模式如何降低创作门槛,提高效率,让每个人都能成为应用开发者。

1213 2
|
人工智能 JavaScript Shell
|

Github 2024-06-10开源项目周报 Top15

根据Github Trendings的统计,本周(2024年6月10日统计)共有15个项目上榜。按开发语言分类,上榜项目数量如下:Python 8项,Jupyter Notebook 和 Go 各2项,C++、Shell、Lua 和 JavaScript 各1项。亮点项目包括Python-100天从新手到大师、Syncthing开源同步工具、初学者的生成式人工智能(第2版)等。这些项目涵盖了代码教育、文件同步、数据分析等多个领域。

404 2
|
人工智能 JSON API
|

一张图读懂大模型应用是如何工作的,一图胜千言

用一张图,带你轻松读懂大模型应用的工作原理。不需要复杂的代码和艰深的理论,只需要一张图,就能让你对大模型有一个全新的认识

2832 2
|
机器学习/深度学习 人工智能 安全
|

通义千问开源的QwQ模型,一个会思考的AI,阿里云百炼邀您第一时间体验

Qwen团队推出新成员QwQ-32B-Preview,专注于增强AI推理能力。通过深入探索和试验,该模型在数学和编程领域展现了卓越的理解力,但仍在学习和完善中。目前,QwQ-32B-Preview已上线阿里云百炼平台,提供免费体验。

4626 0
|
11天前
|
人工智能 自然语言处理 安全
|

AI Agent 职业路线新赛道:智能体时代的防御侧工程化机会

本文揭示AI Agent爆发下的职业新蓝海——防御赛道。聚焦Prompt注入防御、数字身份鉴别、信息流净化三大工程化方向,剖析其技术路径与稀缺价值,为开发者提供逆向破局、高溢价的职业新选择。(239字)

69 1
|
15天前
|
人工智能 数据处理 调度
|

智能体如何被统一管理?AI Agent 指挥官的底层逻辑

AI Agent指挥官是面向多智能体系统的统一调度中枢,通过目标拆解、动态分配、状态管控与闭环约束,解决协作失序、结果不可控等难题,提升自动化系统的稳定性、可解释性与可扩展性,正成为智能体规模化落地的关键基础设施。

111 8
|
16天前
|
人工智能 自然语言处理 运维
|

告别满场救火:资深经理如何靠“AI调度官”稳坐中军?

本文讲述IT经理老张从“超级救火队员”蜕变为“AI调度官”的转型实践:依托Agentic Workflow、RAG与LUI技术,构建数字化“中军帐”,实现从被动救火到主动编排的跃迁,彰显系统思维与人机协同的职场新范式。

82 1
|
17天前
|
存储 运维 监控
|

大模型应用:构建智能大模型运维体系:模型健康度监测系统实践.8

本系统是面向大模型的智能健康度监测平台,采用前后端分离架构(Flask+HTML/CSS/JS),实现四层立体监控(系统资源、模型运行、服务性能、业务质量)。支持实时指标采集、动态基准线告警、多维性能评分及可视化看板,具备请求全链路追踪与预测性运维能力。

91 10
|
21天前
|
人工智能 监控 调度
|

AI Agent 指挥官 vs AI 调度官:谁才是智能体系统的“大脑”?

随着AI迈向多智能体协同,系统分化出两大核心角色:**AI调度官**(专注任务分配与高效执行)与**AI Agent指挥官**(负责目标对齐、结构编排与系统治理)。二者分层协作,构建类操作系统的“智能中枢”,提升稳定性、可解释性与跨行业扩展能力,标志着AI从单点智能走向可持续组织化协同。

131 1
|
26天前
|
机器学习/深度学习 人工智能 算法
|

放弃手搓算法吧!ReEvo:让大模型通过“反思”自动进化出SOTA算法

ReEvo提出“语言梯度”新范式,让大模型通过自我反思进化算法。它使LLM不再盲写代码,而是像专家般分析优劣、总结经验,逐步优化出超越人类设计的启发式算法,在芯片布局、TSP等问题上表现SOTA,实现AI自动“炼”算法的突破。

130 0
|
1月前
|
机器学习/深度学习 人工智能 API
|

构建AI智能体:九十三、基于OpenAI Whisper-large-v3模型的本地化部署实现语音识别提取摘要

本文介绍基于OpenAI Whisper-large-v3模型与FastAPI构建高精度语音转文字服务的实践。涵盖模型加载优化、多格式音频处理、RESTful API设计及生产级部署方案,分享从零打造高性能、可扩展ASR系统的完整经验。

200 14
|
3月前
|
人工智能 弹性计算 自然语言处理
|

史上首次!万卡AI集群支撑双11,通义千问大规模落地

2025年双11,阿里云提供超千万核ECS算力及万卡灵骏智算集群,支撑淘宝推荐等核心业务性能提升超30%。通义千问大模型大规模落地,Qwen-MT单日调用超14亿次,助力商品出海、客服与经营分析,全面赋能双11智能化升级。

546 0
|
3月前
|
人工智能 自然语言处理 算法
|

2025年第13批中国深度合成算法备案分析报告

2025年9月,第13批深度合成算法备案公布,共586项,累计达4420项。北京、广东、浙江、上海居前列,民企为主力,覆盖教育、医疗、金融等领域。文本与对话生成占主导,数字人、多模态技术加速落地。AI应用向行业纵深发展,合规标识成常态,监管趋严推动产业规范创新。

380 77
|
4月前
|
人工智能 开发者
|

从技术到品牌:一个AI指令,让开发者也能写出动人的品牌故事

开发者常擅技术却困于品牌叙事。本文分享一套结构化AI指令,结合DeepSeek、通义千问等国产工具,将品牌故事拆解为可执行模块,助力技术人快速生成有温度、有逻辑的品牌故事框架,实现从代码到共鸣的跨越。

367 5
|
4月前
|
人工智能 前端开发 JavaScript
|

Gemini CLI 架构学习指南

本指南深入解析开源终端AI助手Gemini CLI的架构设计,涵盖项目结构、核心流程与技术栈(TypeScript/React+Ink/Node.js),并提供从环境搭建到贡献代码的四阶段学习路径,助力开发者掌握AI编程工具开发精髓。

755 3
|
4月前
|
人工智能 JSON 监控
|

三步构建AI评估体系:从解决“幻觉”到实现高效监控

AI时代,评估成关键技能。通过错误分析、归类量化与自动化监控,系统化改进AI应用,应对幻觉等问题。Anthropic与OpenAI均强调:评估是产品迭代的核心,数据驱动优于直觉,让AI真正服务于目标。

454 8
|
5月前
|
机器学习/深度学习 人工智能 机器人
|

AI Compass前沿速览:Nano Bananary、MCP Registry、通义DeepResearch 、VoxCPM、InternVLA·M1具身机器人

AI Compass前沿速览:Nano Bananary、MCP Registry、通义DeepResearch 、VoxCPM、InternVLA·M1具身机器人

736 7
|
5月前
|
存储 NoSQL 前端开发
|

Redis专题-实战篇一-基于Session和Redis实现登录业务

本项目基于SpringBoot实现黑马点评系统,涵盖Session与Redis两种登录方案。通过验证码登录、用户信息存储、拦截器校验等流程,解决集群环境下Session不共享问题,采用Redis替代Session实现数据共享与自动续期,提升系统可扩展性与安全性。

352 3
|
5月前
|
存储 负载均衡 数据库
|

鸿蒙 HarmonyOS NEXT端云一体化开发-云函数篇

本文介绍基于华为AGC的端云一体化开发流程,涵盖项目创建、云函数开通、应用配置及DevEco集成。重点讲解云函数的编写、部署、调用与传参,并涉及环境变量设置、负载均衡、重试机制与熔断策略等高阶特性,助力开发者高效构建稳定云端服务。

555 1
|
5月前
|
人工智能 JSON 自然语言处理
|

​​MCP协议:Agent交互的未来标准化之路​​

本文深入解析AI Agent核心能力——工具调用的工作机制,通过构建购物助手实例,详解Agent循环、行动类设计、安全防护与架构优化,并展望MCP协议在标准化交互中的应用前景。

693 1

通义大模型

阿里云自主研发的通义大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

1
今日
1739
内容
8
活动
1159
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大模型服务平台百炼