|
存储 搜索推荐 PyTorch
|

通义千问7B-基于本地知识库问答

上期,我们介绍了通义千问7B模型的微调+部署方式,但在实际使用时,很多开发者还是希望能够结合特定的行业知识来增强模型效果,这时就需要通过外接知识库,让大模型能够返回更精确的结果。

6172 1
|
15天前
|
人工智能 安全
|

智能体来了从 0 到 1 :核心挑战,是非技术性的认知与场景重构

本文探讨AI智能体从概念到落地的核心瓶颈:非模型能力,而在业务理解与结构化水平。指出智能体本质是“决策执行体”,其成败取决于能否将模糊业务目标拆解为可执行、可校验、可容错的逻辑结构,强调目标对齐、任务拆解、知识显性化与人机协同评估体系。

103 3
|
23天前
|
人工智能 监控 API
|

AI Agent 落地实战:破解「浮光行为」困局与开发者职业进阶体系

2024年AI Agent进入落地关键期,但“浮光行为”成核心障碍:表面自动化、实则脱离业务本质。本文揭示其三大工程特征与风险,提出开发者从提示词搭建到多智能体编排的三级进阶路径,倡导以业务建模、元认知技术与系统思维构建真正闭环的智能体系统。

133 0
|
24天前
|
人工智能 监控 算法
|

智能体来了(西南总部)系统设计:AI 调度官的多智能体调度模型

AI调度官作为多智能体系统的核心协调者,通过角色分工、流程显性化、约束控制与闭环反馈,实现智能体高效协同,提升系统稳定性与可治理性,推动AI从单点能力迈向组织级数字基础设施,具备跨行业复用潜力,是产业智能化演进的关键范式。

126 3
|
24天前
|
开发者
|

Qwen的新里程碑🥳

Qwen衍生模型数量突破20万,成为全球首个达成此目标的开源大模型!

148 0
|
24天前
|
人工智能 安全
|

麻烦大佬们看一下,为什么千问在解决初中几何时会出错。

千问在解答初中几何问题时出错,即便告知正确解题思路还是无法更正。

116 5
|
24天前
|
人工智能 运维 API
|

从 Coze API 到智能体系统落地:AI 智能体运营工程师的工程实践解析

在AI 2.0时代,Coze API推动智能体从技术走向生产力。本文聚焦西南实践,解析API调用到商业落地的全流程,揭秘“智能体来了”如何通过插件集成、工作流编排培养具备运营思维的AI工程师,助力开发者转型,抢占智能体时代新机遇。

114 11
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
|

构建AI智能体:六十七、超参数如何影响大模型?通俗讲解原理、作用与实战示例

超参数是机器学习模型训练前需要人工设定的参数,它们控制着模型的学习过程而非直接通过学习获得。文章通过生动的类比(如自行车调整、烹饪配方)解释了超参数的概念,并详细介绍了其调优流程、常见类型(学习率、批量大小等)及对模型的影响。通过实际代码示例,展示了不同超参数设置如何影响模型训练效果,强调合理调优对提升模型性能、防止过拟合和优化资源使用的重要性。文章指出,超参数调优是模型成功的关键,初学者可从默认值开始逐步实验,借助网格搜索等工具实现高效调参。

445 105
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

构建AI智能体:三十八、告别“冷启动”:看大模型如何解决推荐系统的世纪难题

协同过滤是推荐系统中广泛使用的技术,其核心思想是利用用户行为数据发现相似用户或物品进行推荐。摘要包括:1)协同过滤基于用户历史行为数据,通过计算相似度(如余弦相似度、皮尔逊相关系数)预测用户偏好;2)主要分为基于用户(寻找相似用户群体)和基于物品(发现相似物品)两种方法;3)面临冷启动、数据稀疏性等挑战,可通过混合推荐(结合内容特征)和矩阵分解等技术解决;4)典型应用包括电商猜你喜欢和流媒体推荐;5)结合大语言模型可增强语义理解能力,提升推荐准确性。

466 9
|
4月前
|
缓存 PyTorch API
|

TensorRT-LLM 推理服务实战指南

`trtllm-serve` 是 TensorRT-LLM 官方推理服务工具,支持一键部署兼容 OpenAI API 的生产级服务,提供模型查询、文本与对话补全等接口,并兼容多模态及分布式部署,助力高效推理。

653 155
|
4月前
|
机器学习/深度学习 测试技术
|

先SFT后RL但是效果不佳?你可能没用好“离线专家数据”!

通义实验室Trinity-RFT团队提出CHORD框架,通过动态融合SFT与RL,解决大模型训练中“越学越差”“顾此失彼”等问题。该框架引入细粒度Token级权重与软过渡机制,实现从模仿到超越的高效学习,在数学推理与通用任务上均显著提升性能,相关代码已开源。

627 0
|
5月前
|
人工智能 安全 架构师
|

告别旅行规划的"需求文档地狱"!这个AI提示词库,让你像调API一样定制完美旅程

作为开发者,旅行规划如同“需求地狱”:信息碎片、需求多变、缺乏测试。本文提出一套“企业级”AI提示词库,将模糊需求转化为结构化“API请求”,实现标准化输入输出,让AI成为你的专属旅行架构师,30分钟生成专业定制方案,提升决策质量,降低90%时间成本。

683 129
|
5月前
|
JavaScript 前端开发 IDE
|

TypeScript vs. JavaScript:技术对比与核心差异解析

TypeScript 作为 JavaScript 的超集,通过静态类型系统、编译时错误检测和强大的工具链支持,显著提升代码质量与可维护性,尤其适用于中大型项目和团队协作。相较之下,JavaScript 更灵活,适合快速原型开发。本文从类型系统、错误检测、工具支持等多维度对比两者差异,并提供技术选型建议,助力开发者合理选择。

1079 1
|
5月前
|
安全 中间件 应用服务中间件
|

WEB渗透-文件上传漏洞-下篇

本文详解文件上传安全漏洞,涵盖白名单绕过(如00截断、条件竞争)、图片木马制作与利用、以及IIS、Apache、Nginx等常见解析漏洞原理与防御。结合实战案例,深入剖析攻击手法与修复方案。

397 1
|
6月前
|
运维 监控 Cloud Native
|

【云故事探索】NO.17:国诚投顾的云原生 Serverless 实践

国诚投顾携手阿里云,依托Serverless架构实现技术全面升级,构建高弹性、智能化技术底座,提升业务稳定性与运行效率。通过云原生API网关、微服务治理与智能监控,实现流量精细化管理与系统可观测性增强,打造安全、敏捷的智能投顾平台,助力行业数字化变革。

304 9
|
6月前
|
人工智能 自然语言处理 安全
|

零成本打造智能服务端:MCP采样的降本增效实践

本文介绍MCP采样机制,突破传统单向调用模式,实现服务器与客户端LLM的双向协作,提升扩展性、降低成本,支持灵活模型选择。通过FastMCP框架,打造高效分布式AI计算架构。

523 8
|
8月前
|
存储 机器学习/深度学习 人工智能
|

告别OOM!这款开源神器,如何为你精准预测AI模型显存?

在 AI 开发中,CUDA 显存不足常导致训练失败与资源浪费。Cloud Studio 推荐一款开源工具——AI 显存计算器,可精准预估模型训练与推理所需的显存,支持主流模型结构与优化器,助力开发者高效利用 GPU 资源。项目地址:github.com/st-lzh/vram-wuhrai

462 2
|
8月前
|
机器学习/深度学习 人工智能 算法
|

通义OmniAudio大模型,让 AI 看懂 360° 视频,并“听”出对应的空间音频

OmniAudio 是一项突破性的空间音频生成技术,能够直接从 360° 视频生成 FOA(First-order Ambisonics)空间音频,为虚拟现实和沉浸式娱乐带来全新可能。通过自监督 coarse-to-fine 预训练和双分支视频表示微调,OmniAudio 在非空间音频质量和空间定位准确性上显著优于现有方法。项目包含超过 103,000 个视频片段的 Sphere360 数据集,支持高质量的模型训练与评估。代码、数据及论文均已开源,助力沉浸式体验技术发展。

1096 63
|
9月前
|
测试技术 API 开发者
|

LiveBench放榜:Qwen3斩获全球开源冠军

最新一期LiveBench榜单显示,阿里云旗舰模型Qwen3-235B-A22B荣登全球开源模型冠军,小尺寸Qwen3-32B位列Top3。千问3在指令遵循能力上超越多个顶级闭源模型,位居全球第一。该评测由图灵奖得主Yann LeCun发起,采用动态防污染机制,确保公平性。千问3支持119种语言,具备混合推理架构与强大Agent能力,现已上线阿里云百炼平台,提供免费体验与API调用。

828 10
|
人工智能 JSON API
|

使用 Qwen 生成数据模型和进行结构化输出

本教程展示如何使用CAMEL框架和Qwen模型生成结构化数据。CAMEL是一个强大的多智能体框架,支持复杂的AI任务;Qwen由阿里云开发,具备自然语言处理等先进能力。教程涵盖安装、API密钥设置、定义Pydantic模型,并演示了通过Qwen生成JSON格式的学生信息。最后,介绍了如何利用Qwen生成多个随机学生信息的JSON格式数据。欢迎在[CAMEL GitHub](https://github.com/camel-ai/camel)上为项目点星支持。

4026 70
|
存储 人工智能 安全
|

从梦想到现实:十年见证AI自动化漏洞修复的演变

2014年,我怀揣着利用科技创造更安全数字世界的梦想,提出了通过云平台自动化修复第三方网站漏洞的构想。十年后的2024年,随着AI技术的崛起,这一梦想已成为现实。如今,用户只需简单注册并安装插件,AI系统就能自动检测、修复漏洞,整个过程高效、智能。AI不仅提升了系统的可靠性和效率,还具备自我学习能力,使安全防护更加主动。未来,我将继续用AI探索更多可能,推动技术的发展,不断完善这个充满智慧与安全的数字世界。

359 3
|
人工智能 IDE 测试技术
|

使用通义灵码提升Python开发效率:从熟悉代码到实现需求的全流程体验

作为一名Python开发者,我最近开始使用通义灵码作为开发辅助工具。它显著提高了我的工作效率,特别是在理解和修改复杂代码逻辑方面。通过AI编码助手,我能够在短时间内快速上手新项目,实现新需求,并进行代码优化,整体效率提升了60%以上。通义灵码不仅加快了代码生成速度,还增强了代码的健壮性和稳定性。

706 2
|
前端开发
|

使用LangGraph构建多Agent系统架构!

【10月更文挑战第7天】

2428 0
|
存储 人工智能
|

AI大模型企业应用实战-为Langchain Agent添加记忆功能

【8月更文挑战第18天】

1194 0
|
机器学习/深度学习 人工智能 自然语言处理
|

AI大模型应用开发实战(01)-大语言模型发展

【8月更文挑战第2天】

1087 7
|
人工智能 编解码 API
|

通义万相AIGC技术测评报告

**摘要:** 通义万相是阿里云的AI绘画模型,提供清晰的部署指南和易用的API,适合新手。资源部署耗时约10分钟,API响应快,支持多种风格图片生成,适用于广告、媒体等领域。产品性价比高,功能包括文本到图像转换等,但仍有改进空间,如增加服装纹理选项、互动功能和更多API接口。建议完善功能、加强推广和降低成本以吸引更多用户。[链接](https://developer.aliyun.com/topic/tongyi-wanxiang?spm=a2c6h.27063436.J_6978680750.5.3a774f461hv8qD)

1452 6
|
弹性计算 API Python
|

如何利用通义千问查询阿里云资源

本篇文章详细阐述了如何利用LangChain框架构建一款Python工具,该工具能够调用通义千问大模型来查询和获取阿里云资源信息。

116286 48

大模型存在难以逾越的天花板

【1月更文挑战第20天】大模型存在难以逾越的天花板

302 1
|
13天前
|
人工智能 自然语言处理 运维
|

Agent数量放大后的AI Agent指挥官与AI调度官

随着AI Agent规模扩大,任务冲突、资源争用等问题凸显。本文提出“AI指挥官”(定策略、控目标)与“AI调度官”(管执行、优资源)双角色分层治理机制,构建指挥—调度—执行闭环,提升大规模智能协同的可控性、稳定性与可扩展性。

72 1
|
17天前
|
人工智能 自动驾驶 机器人
|

2026 AI 元年:从技术狂欢到价值共生的智能新纪元

本文基于公开资料与行业观察,分析AI从“模型能力展示”向“真实场景应用”的演进趋势,探讨世界模型、具身智能、多智能体系统等方向的进展与挑战,涵盖工业、金融、医疗等领域案例,提供中立、务实的技术与产业参考视角。

105 1
|
2月前
|
机器学习/深度学习 人工智能 API
|

MaaS市场全球领导者!阿里云5项能力获评最高评级

18日,Omdia发布《2025年全球企业级MaaS市场分析》报告,阿里云获评全球领导者,在基础模型、精调、Agent开发等5大维度获最高评级,为中国第一。报告指出,MaaS已进入2.0阶段,需提供全栈AI能力。阿里云凭借PAI-灵骏、百炼平台及Qwen系列大模型,成为领先“能力交付者”。其新技术Aegaeon降低GPU用量82%,通义千问研究获NeurIPS 2025最佳论文奖,显著提升模型效率。目前,阿里通义大模型服务超100万客户,覆盖国际奥委会、宝马、LV等知名机构。2025上半年,《财富》中国500强中7成已用GenAI,阿里云渗透率达53%,居首。

252 9
|
3月前
|
人工智能 语音技术 流计算
|

一图掌握通义千问:模型生态与应用场景全览

通义千问(Qwen)系列提供全栈开源AI能力,涵盖语言、视觉、语音等多模态应用。旗舰模型Qwen3-Max性能领先,支持92种语言翻译与高精度语音识别,具备强大代码生成与图像处理能力,助力开发者与企业高效构建智能应用。

638 2
|
4月前
|
人工智能 架构师 物联网
|

2小时打造专业医疗助手:基于CareGPT与Qwen3-8B的微调实战

基于CareGPT和Qwen3-8B模型,采用LoRA方法在专业医疗数据集上进行微调实践,该技术方案在保持模型通用能力的同时,显著提升了医疗问答的专业性和实用性,系统性地构建一个真正“懂症状、能判断”的智能医疗助手。从技术演进角度看,微调后的模型与医疗系统深度融合将释放更大价值。这种"领域微调+系统集成"的技术路径,为AI在医疗等专业场景的落地提供了经过验证的解决方案。

553 3
|
5月前
|
人工智能 自然语言处理 前端开发
|

从零到上线:用 Qwen3-Coder 和 MCP 打造儿童学习助手

本教程介绍如何利用Qwen3-Coder模型与VS Code插件打造儿童学习助手,涵盖AI编程、代码优化与网页部署,助你掌握真实场景开发技巧。

1051 28
|
10月前
|
存储 人工智能 监控
|

通过阿里云Milvus与通义千问VL大模型,快速实现多模态搜索

阿里云向量检索服务Milvus版是一款全托管向量检索引擎,并确保与开源Milvus的完全兼容性,支持无缝迁移。它在开源版本的基础上增强了可扩展性,能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警,Milvus云服务成为多样化AI应用场景的理想选择,包括多模态搜索、检索增强生成(RAG)、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作,进一步促进应用的快速开发和部署。

939 2
|
存储 JSON 安全
|

使用 Qwen 进行Self-instruct数据生成

使用Qwen进行自指令数据生成,通过Self-instruct技术自动化为大型语言模型生成指令。用户可安装CAMEL包并设置Qwen API密钥,配置ChatAgent和SelfInstructPipeline,基于种子指令迭代生成大量新指令。支持多种过滤器(如长度、关键词、标点符号等)确保生成指令的质量和多样性。欢迎加入Discord获取支持与交流。

874 8
|
人工智能 自然语言处理 数据可视化
|

阿里云AI大模型助力客户对话分析——全方位提升服务与体验

随着数字化转型的推进,企业愈发重视客户互动数据的价值。阿里云推出了一套基于AI大模型的客户对话分析解决方案,通过自动化手段分析大量客户对话数据,提取有价值信息,优化服务流程,提升客户体验。本文将结合技术文档和实际体验,全面评测这一解决方案。

1069 2
|
人工智能 JavaScript Apache
|

Github 2024-06-03 开源项目周报 Top15

本周Github Trendings共有15个项目上榜,按开发语言汇总,Python项目最多,共8项;TypeScript项目6项;HTML、Lua、Jupyter Notebook、Dart和C++各1项。亮点项目包括增强人类能力的开源框架Fabric,自托管游戏流主机Sunshine,以及多种AI驱动的工具和平台,如Khoj、Ente和Dataherald等。这些项目不仅在技术创新上有所突破,还在社区中获得了广泛的关注和支持。

694 0
|
自然语言处理 开发者
|

通义语音大模型评测:CosyVoice与SenseVoice

随着人工智能技术的不断发展,语音生成和理解模型在各个领域得到了广泛应用。本文将评测两个由FunAudioLLM团队开发的多语言语音模型——[CosyVoice](https://github.com/FunAudioLLM/CosyVoice)和[SenseVoice](https://github.com/FunAudioLLM/SenseVoice),并结合阿里云开发者社区的相关资源,探讨其在实际应用中的表现。

3377 3
|
人工智能 搜索推荐
|

AI能力更加原子化,业务流程迈向“无感智能”

【1月更文挑战第7天】AI能力更加原子化,业务流程迈向“无感智能”

760 1
|
人工智能 算法 程序员
|

AI编码助手:探索其效能与限制

众所周知,AI编码助手是当下技术发展的产物,它的出现给开发者们带来了许多便利和效率提升,但是对于只允许使用AI编写代码而禁止程序员手写的做法,我个人觉得还是要从长计议。甚至是随着AI编码助手的快速发展,开发者们纷纷试用这些AI工具以提高开发和工作效率,但是有些公司甚至要求只允许使用AI编写代码,不允许程序员手写。那么本文就来聊聊关于只允许使用AI编写代码,不允许程序员手写这种做法的可行性,并探讨分享一下AI编码助手的潜力与限制。

1063 7
|
机器学习/深度学习 人工智能 计算机视觉
|

AIGC基础模型——Vision Transformer (ViT)

【1月更文挑战第12天】AIGC基础模型——Vision Transformer (ViT)

745 6
|
人工智能 自然语言处理 测试技术
|

什么是通义灵码?

什么是通义灵码?

1941 0
|
缓存 达摩院 Kubernetes
|

数据缓存系列分享(六):通义千问Qwen-14B大模型快速体验

阿里达摩院近期对通义千问大模型 Qwen-14B 进行了开源(之前开源的是Qwen-7B模型),目前在ModelScope和HuggingFace上均可直接下载。关于Qwen-7B的搭建可以参考我们之前的文章:数据缓存系列分享(五):开源大语言模型通义千问快速体验版,本文将使用一样的方式打开Qwen-14B,快速体验一下。

2559 0

2024届通义校园招聘正式启动

2024届通义校园招聘正式启动

1776 0
|
人工智能 架构师 算法
|

通义万相、ModelScopeGPT等亮相2023世界人工智能大会

通义万相、ModelScopeGPT等亮相2023世界人工智能大会

1415 0
|
人工智能 达摩院 自然语言处理
|

让AI更通用的“通义”大模型,来了!

让AI更通用的“通义”大模型,来了!

1622 0
|
Web App开发 人工智能 算法
|

阿里云“通义听悟”正式公测:用户可免费领100小时转写服务

用大模型自动做笔记、提取PPT、整理访谈,阿里云AI新产品“通义听悟”开放公测

11404 4
|
机器学习/深度学习 人工智能 达摩院
|

覆盖200+服务场景,阿里「通义」大模型系列打造国内首个AI统一底座(1)

覆盖200+服务场景,阿里「通义」大模型系列打造国内首个AI统一底座

2525 0
|
20天前
|
人工智能 监控 调度
|

AI 调度官 vs AI 指挥官:边界与误区对照表

AI调度官是多智能体系统的运行中枢,专注执行编排、资源调度与状态监控,不参与目标决策或业务判断。其核心价值在于保障系统稳定、高效、可解释、可扩展,是组织级智能协同的基础设施型角色。

111 7

通义大模型

阿里云自主研发的通义大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

1
今日
1739
内容
8
活动
1159
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大模型服务平台百炼