|
存储 自然语言处理 前端开发
|

2025年大模型发展脉络:深入分析与技术细节

本文深入剖析2025年大模型发展脉络,涵盖裸模型与手工指令工程、向量检索、文本处理与知识图谱构建、自动化提示生成、ReAct多步推理及AI Agent崛起六大模块。从技术细节到未来趋势,结合最新进展探讨核心算法、工具栈与挑战,强调模块化、自动化、多模态等关键方向,同时指出计算资源、数据质量和安全伦理等问题。适合关注大模型前沿动态的技术从业者与研究者。

3790 9
|
自然语言处理 前端开发 Serverless
|

基于阿里云通义千问开发编程辅助与代码生成工具

随着软件开发需求的增加,编程辅助与代码生成工具成为开发者提高效率的利器。这类工具能够根据用户描述生成代码片段、协助调试、生成自动化脚本等,大大减少重复性劳动。阿里云通义千问作为一款先进的大语言模型,具备强大的自然语言处理和代码生成能力,非常适合用于开发这样的工具。

3382 3
|
1月前
|
机器学习/深度学习 自然语言处理 供应链
|

大模型应用:销量预测升级:Qwen大模型让时序分析从算数值到给建议.82

本文提出“会说话的时序分析系统”,融合ARIMA、Prophet等专业预测算法与大模型,实现从冰冷数值到自然语言洞察的跃迁:算法精准算未来,大模型解读原因、生成可落地建议,让时序数据真正成为懂业务、会决策的智能助手。

412 3
|
4月前
|
机器学习/深度学习 人工智能 缓存
|

构建AI智能体:九十二、智能协作的艺术:大模型上下文与Token优化指南

本文深入解析大模型上下文窗口与Token优化机制,阐明其作为协作“白板”的核心作用。通过精简提示、结构化输入、控制输出等策略,开发者可有效降低Token消耗,提升AI应用的效率与经济性。

1184 7
|
人工智能 自然语言处理 机器人
|

招商银行X通义大模型,2024年度AI最佳实践案例!

招商银行X通义大模型,2024年度AI最佳实践案例!

1668 2
|
前端开发
|

使用LangGraph构建多Agent系统架构!

【10月更文挑战第7天】

3028 0
|
16天前
|
人工智能 自然语言处理 安全
|

适配 Win11 专业版家庭版 OpenClaw 本地 AI 部署避坑指南

OpenClaw(小龙虾)是GitHub获28W+星标、纯本地运行的AI智能体,支持Win11全版本。具备全自动操控、文件整理、浏览器/办公自动化等能力,数据不出本机,隐私安全拉满。本教程提供Windows 11专属一键部署包,免配环境、双击安装,专治Defender拦截、中文路径报错等痛点,新手5分钟极速上手。(239字)

235 0
|
22天前
|
数据采集 算法 量子技术
|

大模型应用:隐私优先的大模型应用:同态加密与大模型结合的完整实践.101

本文深入浅出解析“同态加密+大模型”技术:以全同态加密(FHE)为核心,实现敏感数据(如金融、医疗信息)在密文状态下完成大模型推理,全程不暴露明文,兼顾隐私与智能。涵盖原理、流程、数学基础及Python简易实现。

242 6
|
2月前
|
监控 并行计算 算法
|

大模型应用:多卡集群跑满14B模型:大模型推理算力应用实践.66

本项目面向10台RTX 4090集群,优化Qwen-14B大模型推理:通过NF4量化压缩显存、动态批处理(基于Amdahl定律)提升GPU利用率至85%+、多卡模型并行均衡负载,解决卡顿、显存溢出与调度不均问题,支撑日均10万次高并发稳定服务。

395 6
|
2月前
|
运维 调度 数据中心
|

Infiniband/以太网,算力组网布线方案

本文详解SuperPOD构建:以32台DGX H100/H200为单元(SU),采用叶脊(Spine-Leaf)网络架构,通过多模光纤/DAC短距连接服务器与叶交换机,单模光纤长距连接叶与脊交换机;支持点对点与结构化布线,提升扩展性、管理效率与运维灵活性。(239字)

378 0
|
2月前
|
人工智能 自然语言处理 数据可视化
|

【深度建议】打破设备壁垒:关于通义千问实现“全平台智能语音交互”与“知识闭环”的五大核心建议

作为通义千问深度用户,本文基于跨端真实体验,提出五大优化建议:①全平台语音输入引擎(补PC端短板);②沉浸式声音陪伴系统;③智能笔记与待办管理;④语义级长对话检索与跳转;⑤紧急修复移动端搜索点击失效Bug。聚焦效率与温度,助力千问成为更懂你的AI伙伴。(239字)

525 1
|
2月前
|
JSON API 数据安全/隐私保护
|

大模型应用:大模型的本地 API 服务:FastAPI 封装与接口鉴权.44

本文详解本地大模型API的接口发布与鉴权调试,重点介绍Postman工具实操。涵盖FastAPI封装原理、API Key与极简JWT两种鉴权方式,深入解析JWT结构(Header/Payload/Signature)、无状态验证、过期机制及完整调用流程,助开发者安全、高效调试本地大模型服务。

662 7
|
3月前
|
存储 人工智能 缓存
|

我用半天时间,一行代码没写ai的一个开源软件 ”一个仓库,管理所有 AI 工具配置“

DotAI 是一个开源工具,通过 Git 统一管理 Cursor、Claude、Copilot 等十余款 AI 编程助手的原生配置,零格式转换、自动分发、支持用户/项目双作用域,并提供 CLI 与 VSCode 插件双界面。

597 2
|
4月前
|
人工智能 自然语言处理 数据可视化
|

大模型应用:大模型本地部署实战:从零构建可视化智能学习助手.2

本文介绍了一个基于Qwen1.5-1.8B大模型的本地部署AI学习助手系统。该系统在CPU环境下运行,通过Gradio提供Web界面,具备智能对话、学习示例生成等功能。文章详细阐述了模型选择、系统架构设计、提示词优化、用户界面实现等关键技术点,重点讨论了参数配置优化策略,包括模型加载、输入处理、生成策略等核心参数。该系统实现了在消费级硬件上部署智能教育助手,保障数据隐私的同时提供多学科问答支持,具有预设问题、上下文记忆等特色功能,适合作为本地化学习辅助工具。

1168 9
|
7月前
|
文字识别 自然语言处理 API
|

同时斩获两个开源第一,超火的通义Qwen3-VL CookBook来了

Qwen3-VL开源发布后广受认可,登顶Chatbot Arena视觉榜与OpenRouter图像处理市场份额第一。支持文档解析、OCR、视频理解、3D定位等多模态任务,现推出详细Cookbook助力开发者高效应用。

2004 3
|
机器学习/深度学习 人工智能 自然语言处理
|

通义千问推理模型QwQ-32B开源,更小尺寸、更强性能

阿里云发布并开源全新推理模型通义千问QwQ-32B,通过大规模强化学习,在数学、代码及通用能力上实现质的飞跃,性能比肩DeepSeek-R1。该模型大幅降低部署成本,支持消费级显卡本地部署,并集成智能体Agent相关能力。阿里云采用Apache2.0协议全球开源,用户可通过通义APP免费体验。此外,通义团队已开源200多款模型,覆盖全模态和全尺寸。

1812 20
|
6小时前
|
缓存 人工智能 安全
|

90% 的人不知道 Claude Code 还有插件系统!官方从未公开的 6 大组件深度拆解

本文深度拆解 Claude Code 插件系统的 6 大核心组件:Skills、Hooks、Agents、MCP、规则文件与配置系统,帮你快速上手插件开发与管理。

43 1
|
29天前
|
人工智能 自然语言处理 算法
|

大模型应用:从手动调参到智能寻优:PSO 驱动的大模型参数自动化优化.94

本文介绍PSO(粒子群优化)与大模型结合的自动化调参方法:将高维、非凸、难量化的调参问题转化为智能寻优工程,利用PSO全局搜索能力+大模型效果评估能力,实现推理、检索、生成等参数的高效、自动、最优配置。

224 4
|
2月前
|
存储 并行计算 数据可视化
|

大模型应用:GPU的黑盒拆解:可视化看透大模型并行计算的底层逻辑.67

本文深入解析GPU核心架构与大模型算力优化原理,涵盖SM流式多处理器、显存、显存控制器、PCIe接口等关键组件,详解线程级/指令级并行及张量核心加速机制,并通过全流程耗时分析与任务拆分可视化,揭示“数据传输是主要瓶颈”的核心结论,助力高效部署大模型。

464 6
|
2月前
|
人工智能 安全 算法
|

APP上架与合规运营资质详解:涵盖社交、直播等特殊类别APP

APP上架与合规运营是一项系统且复杂的工程,资质要求是其中的关键“关卡”。充分了解并认真准备各项资质,不仅能让你的APP顺利通过审核,呈现在用户面前,更是为其长远健康发展提供有力保障,并且完备的资质准备,更是构建用户信任、防范运营风险的基石。

470 1
|
9月前
|
存储 自然语言处理 前端开发
|

百亿级知识库解决方案:从零带你构建高并发RAG架构(附实践代码)

本文详解构建高效RAG系统的关键技术,涵盖基础架构、高级查询转换、智能路由、索引优化、噪声控制与端到端评估,助你打造稳定、精准的检索增强生成系统。

1978 2
|
9月前
|
存储 数据库
|

RAG分块技术全景图:5大策略解剖与千万级生产环境验证

本文深入解析RAG系统中的五大文本分块策略,包括固定尺寸、语义、递归、结构和LLM分块,探讨其工程实现与优化方案,帮助提升知识检索精度与LLM生成效果。

1318 1
|
弹性计算 并行计算 Shell
|

在云上搭建CosyVoice环境-保姆级教程

发现个好玩的模型,阿里最近开源的,可以便捷的复刻人声,本文提供全套安装过程。仓库地址:https://github.com/FunAudioLLM/CosyVoice。

6761 1
|
3天前
|
机器学习/深度学习 人工智能 缓存
|

大模型应用:智能对话意图识别:基于关键词、语义向量与大模型的三重融合验证.120

本文系统梳理了智能体意图识别的演进路径与工业级落地实践,从关键词匹配、语义向量相似度计算到大模型精准验证,提出“规则+语义+大模型”三阶段集成方案,兼顾准确性、泛化性与可部署性,助力AI真正听懂用户真实诉求。

42 1
|
1月前
|
人工智能 弹性计算 机器人
|

【最新版】阿里云一键部署OpenClaw步骤、配置千问大模型、接入飞书机器人完整实战教程

2026年,AI智能体已经从概念走向实用化。OpenClaw(曾用名Clawdbot)作为轻量化、高稳定、可长期运行的开源AI执行框架,成为个人与小型团队搭建专属智能助手的首选方案。

465 1
|
1月前
|
人工智能 缓存 数据中心
|

大模型应用:大模型多线程推理:并发请求的处理与资源隔离实践.77

本文详解大模型多线程推理与资源隔离技术:通过共享模型、隔离缓存、限制线程数/生成长度/超时时间,实现高并发、低延迟、稳服务。单线程串行耗时85.7秒,多线程(3线程)降至66.5秒,显著提升吞吐量与资源利用率,是大模型规模化落地的核心工程实践。

393 7
|
3月前
|
自然语言处理 Linux 语音技术
|

大模型应用:一文读懂TTS技术应用:基础入门到实战的全场景指南.18

本文系统讲解TTS(文本转语音)技术,涵盖原理、指标与实战:详解pyttsx3(离线)和gTTS(在线)两大入门方案,演示单文本播报、多语言生成、批量转换、情感模拟、实时提醒及Flask接口封装等全场景应用,并提供选型建议与常见问题解决方案。

993 10
|
9月前
|
机器学习/深度学习 存储 人工智能
|

深度解析大模型压缩技术:搞懂深度学习中的减枝、量化、知识蒸馏

本文系统解析深度学习模型压缩三大核心技术:剪枝、量化与知识蒸馏,详解如何实现模型缩小16倍、推理加速4倍。涵盖技术原理、工程实践与组合策略,助力AI模型高效部署至边缘设备。

1786 2
|
分布式计算 API Linux
|

通义千问API:找出两篇文章的不同

本章我们将介绍如何利用大模型开发一个文档比对小工具,我们将用这个工具来给互联网上两篇内容相近但版本不同的文档找找茬,并且我们提供了一种批处理文档比对的方案

12629 6
|
2月前
|
机器学习/深度学习 缓存 监控
|

大模型应用:矩阵乘加(GEMM)全解析:大模型算力消耗的逻辑与优化.68

GEMM(矩阵乘加)是大模型算力核心,占Transformer计算量90%以上。本文系统解析其数学原理、高维适配、算力测算公式,并详解INT8/INT4量化、矩阵分块、硬件加速与批处理四大优化策略,结合代码示例与性能监控方法,助力高效推理落地。

504 17
|
人工智能 机器人 API
|

搞定!微信接入DeepSeek打造聊天机器人,1行代码就行!

程序员晚枫分享了一个有趣的Python项目,将DeepSeek大模型接入微信,实现自动聊天。通过PyOfficeRobot库,仅需1行代码即可完成接入,打造AI聊天机器人。该项目基于Windows API操作微信,目前仅支持Windows系统。用户需填写好友名称和API Key,轻松体验AI对话。此外,PyOfficeRobot还支持其他大模型如阿里通义、智谱等。欢迎尝试并参与改进开源项目。

2328 81
|
存储 人工智能 自然语言处理
|

通义千问 Qwen 系列的 Agent 方向探索

通义千问Qwen系列在AI领域展现了强大的Agent方向探索能力,包括灵活的Tool调用、单/多Agent场景实践等,通过丰富的代码示例展示了其在文本生成、信息检索、任务自动化及专业领域应用等方面的优势,为复杂应用场景提供了多元且实用的解决方案。

1872 3
|
人工智能 自然语言处理
|

还在因AI检测头疼?尝试一下 AI Humanize

AI Humanize是一款将AI文本转化为人性化、难以检测的高质量内容的工具。它提供基础和高级模型,支持多语言,如英语、中文等,并能在多种AI检测器中通过。训练于大量人类语料库,AI Humanize的"Humanize AI LLM"模型确保生成自然、流畅的文本,增强可读性和原创性,同时保持用户友好界面。适用于各领域的用户提升内容质量。[AI Humanize](https://aihumanize.io/)**

1460 0
|
数据可视化 物联网 PyTorch
|

通义千问7B模型开源,魔搭最佳实践来了

通义千问开源!阿里云开源通义千问70亿参数模型,包括通用模型Qwen-7B-Base和对话模型Qwen-7B-Chat,两款模型均已上线ModelScope魔搭社区,开源、免费、可商用,欢迎大家来体验。

49582 59
|
1天前
|
机器学习/深度学习 自然语言处理 监控
|

大模型应用:Qwen1.5+ChatGLM3联合评测:不同体量大模型意图识别差异验证.122

本文对比评测Qwen1.5-1.8B、ChatGLM3-6B及语义向量模型在意图识别任务中的表现,从准确率、召回率、F1值、响应时间等维度深入分析。实验表明:小模型Qwen1.8B识别能力弱、稳定性差;ChatGLM3-6B达100%宏平均F1,精度卓越但耗时高;混合架构(向量模型兜底+大模型攻坚)兼顾速度与精度,是落地优选方案。

40 2
|
27天前
|
自然语言处理 数据可视化 数据挖掘
|

大模型应用:从数据分布到智能解读:KDE 与大模型的深度融合实践.96

本文详解KDE与大模型融合的数据分析新范式:KDE精准刻画数据分布规律(峰值、偏态、异常值等),大模型将其转化为通俗易懂、可落地的业务洞察,实现“数据→分布→决策”闭环。兼顾技术严谨性与业务可解释性。

179 3
|
4月前
|
人工智能 数据处理 调度
|

智能体如何被统一管理?AI Agent 指挥官的底层逻辑

AI Agent指挥官是面向多智能体系统的统一调度中枢,通过目标拆解、动态分配、状态管控与闭环约束,解决协作失序、结果不可控等难题,提升自动化系统的稳定性、可解释性与可扩展性,正成为智能体规模化落地的关键基础设施。

414 8
|
4月前
|
机器学习/深度学习 数据采集 人工智能
|

大模型应用:大模型参数调优:结合本地模型对比多种组合探索差异.7

本文系统解析大模型核心生成参数(如temperature、top_p、top_k、repetition_penalty等)的原理、作用机制与实践影响,结合Qwen1.5-1.8B本地模型实测,通过创意写作、技术问答、代码生成三类任务对比分析参数组合效果,并提供分场景调优建议与黄金配置方案,助力从“调参新手”进阶为“生成质量掌控者”。

659 21
|
Arthas 监控 Java
|

Arthas trace (方法内部调用路径,并输出方法路径上的每个节点上耗时)

Arthas trace (方法内部调用路径,并输出方法路径上的每个节点上耗时)

1916 10
|
12天前
|
BI
|

敏感内容识别技术解析:防泄密系统如何判断一份文件是否值得重点保护

防泄密系统能不能真正工作,第一步不是拦截,而是识别。系统如果不知道哪些文件里包含客户信息、财务数据、投标底稿、研发资料或者源代码,那么后续所有拦截动作都只能是盲控。`Ping64` 这类产品真正要解决的,不是单纯看到一个上传动作,而是先判断上传的到底是不是敏感内容。

109 0
|
2月前
|
存储 机器学习/深度学习 人工智能
|

大模型应用:大模型本地部署的磁盘空间优化:模型分片存储与按需加载.48

本文详解大模型本地部署的磁盘与显存优化方案:通过分片存储(将大模型切分为多个小文件)与按需加载(运行时动态加载所需分片),显著降低硬件门槛。以Qwen1.5-1.8B为例,完整演示分片生成、索引构建、完整性校验、加载测试及跨分区部署,确保效果不降、资源占用大减。

605 20
|
3月前
|
存储 机器学习/深度学习 人工智能
|

大模型应用:通俗理解大模型量化:从概念到实践的原理流程完整拆解.38

大模型量化是通过降低参数精度(如FP32→INT8),在几乎不损精度的前提下,显著压缩模型体积、提升推理速度、降低硬件门槛与功耗的关键技术,使大模型得以落地手机、PC等端侧设备。

649 16
|
4月前
|
存储 人工智能 自然语言处理
|

企业AI落地第一步:用RAG技术,让大模型“读懂”你的内部知识库

大家好,我是AI伙伴狸猫算君。本文带你深入浅出了解RAG(检索增强生成)——让大模型“懂”企业私有知识的利器。通过“先检索、再生成”的机制,RAG使AI能基于公司文档精准作答,广泛应用于智能客服、知识库问答等场景。文章详解其原理、四步架构、Python实战代码及评估方法,助力非算法人员也能快速构建企业专属AI助手,实现知识智能化落地。

1085 1
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

构建AI智能体:六十一、信息论完全指南:从基础概念到在大模型中的实际应用

摘要: 信息论是人工智能尤其是大语言模型的核心数学工具。本文系统介绍了八大核心概念: 信息量:衡量事件意外程度,公式为I(x)=-log₂P(x) 信息熵:评估系统不确定性,H(X)=-ΣP(x)log₂P(x) 联合熵/条件熵:分析多变量关系及条件不确定性 互信息:量化变量间共享信息量 KL散度:衡量概率分布差异 交叉熵:模型训练的核心损失函数 在大语言模型中,这些概念被广泛应用于: 训练阶段:交叉熵优化预测,KL散度防止过拟合 推理阶段:温度参数调节生成文本的创造性(高熵增加多样性)

781 2
|
6月前
|
人工智能 自然语言处理 开发者
|

周报不是流水账,这个AI指令帮你写出让老板点赞的工作汇报

一个帮助技术人快速生成专业工作周报的AI指令,通过结构化输入和价值导向表达,让你的周报从流水账变成让老板点赞的高质量汇报,15分钟搞定原本需要1小时的周报撰写。

1663 80
|
9月前
|
编解码 自然语言处理
|

通义万相开源14B数字人Wan2.2-S2V!影视级音频驱动视频生成,助力专业内容创作

今天,通义万相的视频生成模型又开源了!本次开源Wan2.2-S2V-14B,是一款音频驱动的视频生成模型,可生成影视级质感的高质量视频。

1994 29
|
自然语言处理 测试技术 Serverless
|

Qwen3开源发布:Think Deeper, Act Faster!社区推理、部署、微调、MCP调用实战教程来啦!

Qwen3开源发布:Think Deeper, Act Faster!社区推理、部署、微调、MCP调用实战教程来啦!

3138 22
|
人工智能 达摩院 搜索推荐
|

通义大模型:解码中国AI的"通"与"义"

“通义”取自中国传统文化中“通晓大义”,寓意技术与人文的结合。作为阿里巴巴旗下的超大规模语言模型,通义在知识蒸馏、动态稀疏激活和文化感知模块上实现三大突破,大幅提升效率与适切性。其已在医疗、司法、文化传播等领域落地,如辅助病历处理、法律文书生成及文物解说等。测试显示,通义在中文诗歌创作、商业报告生成等方面表现优异。同时,开放的开发者生态已吸引5万+创新者。未来,通义将探索长期记忆、自我反思及多智能体协作,向AGI迈进,成为智能本质的载体。其对中文语境情感的精准把握,更是中国AI“通情达义”的典范。

3861 22
|
人工智能 API Python
|

三分钟快速搭建基于FastAPI的AI Agent应用!

【10月更文挑战第1天】

1945 0
|
11天前
|
人工智能 安全 机器人
|

一句话就能“劫持”你的AI?DZS 分层式自适应提示词注入攻击的防御机制框架 (HAA)来了!

本文介绍“DZS分层式自适应防御框架(HAA)”,一种无需微调、不改模型的提示词注入防御方案。已发布预印本(DOI:10.21203/rs.3.rs-9653510/v1),支持主流LLM,可有效识别并隔离恶意指令,守住AI任务边界。(239字)

119 7

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

2
今日
1955
内容
8
活动
1408
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大模型服务平台百炼