决策智能

首页 标签 决策智能
# 决策智能 #
关注
2466内容
|
1月前
| |
AI律师数字分身:法律科技领域的多智能体架构实践
AI数字分身破解法律服务规模化难题,通过多模态智能体实现7×24小时咨询响应、案情结构化提取与智能分流。基于知识图谱与推理引擎,提升律所线索留存率与律师人效,推动法律服务降本增效。
基于人类反馈的强化学习:对齐AI与人类价值观的技术革命
基于人类反馈的强化学习(RLHF)是一种通过人类偏好来训练AI的技术,使其行为更符合人类价值观。它分三阶段:先用示范数据微调模型,再训练奖励模型预测人类偏好,最后用强化学习优化模型。相比传统方法,RLHF在安全性、创造力、数据效率等方面优势显著,能有效提升AI的对齐性与实用性,是实现有益人工智能的关键路径。
阿里云PAI-灵骏大模型训练工具Pai-Megatron-Patch正式开源!
随着深度学习大语言模型的不断发展,其模型结构和量级在快速演化,依托大模型技术的应用更是层出不穷。对于广大开发者来说不仅要考虑如何在复杂多变的场景下有效的将大模型消耗的算力发挥出来,还要应对大模型的持续迭代。开发简单易用的大模型训练工具就成了应对以上问题广受关注的技术方向,让开发者专注于大模型解决方案的开发,降低大模型训练加速性能优化和训练/推理全流程搭建的人力开发成本。阿里云机器学习平台PAI开源了业内较早投入业务应用的大模型训练工具Pai-Megatron-Patch,本文将详解Pai-Megatron-Patch的设计原理和应用。
智能解决装箱问题:使用优化算法实现高效包装
装箱问题(Bin Packing Problem)是组合优化领域中的一个经典问题,主要涉及如何将一系列对象高效地装入有限数量的容器(或“箱”)中,同时满足特定的约束条件。这个问题的目标是最小化所需使用的箱子数量或者最大化箱子的装载效率,以减少空间或资源的浪费。
ViDoRAG:开源多模态文档检索框架,多智能体推理+图文理解精准解析文档
ViDoRAG 是阿里巴巴通义实验室联合中国科学技术大学和上海交通大学推出的视觉文档检索增强生成框架,基于多智能体协作和动态迭代推理,显著提升复杂视觉文档的检索和生成效率。
小米7B参数推理大模型首次开源!Xiaomi MiMo:数学代码双杀,超越32B巨头
小米开源的MiMo推理大模型通过联动预训练与强化学习算法,在7B参数规模下实现数学推理与代码生成能力的突破性提升,技术报告显示其性能超越部分32B级模型。
|
5月前
|
单一智能体 + MCP看似全能,为何却隐藏诸多局限?
本文产品专家三桥君对比了AI应用开发中的两种架构选择:单一智能体配合MCP协议和多智能体系统(MAS)。单一智能体架构通过MCP协议调用工具,适合中小型项目和快速上线,但存在中心化瓶颈和单点故障风险。MAS由多个智能体协作,支持专业分工和高并发,但设计复杂、协调成本高。三桥君通过客户服务助手、投资分析等案例展示了不同架构的适用场景,并提供了技术栈推荐和部署建议,强调应根据业务需求、资源和技术能力选择合适架构,平衡效率与复杂度。
免费试用